Apache POI — мощная библиотека для работы с различными документами пакета Microsoft Office на Java. Она включает API для чтения и создания новых документов Word, Excel, Visio, и работы с другими форматами файлов MS Office.
Интересный факт. Название библиотеки Apache POI является аббревиатурой от «Poor Obfuscation Implementation», что дословно переводится «Плохо Реализованная Обфускация» — это название было шуткой, придуманной программистами с хорошим чувством юмора, но позже оно стало официальным.
Кто не знает, обфускация — это намеренное запутывание кода для усложнения анализа структуры программы и алгоритмов при декомпиляции приложения.
Чтобы работать с Apache POI, ее нужно включить проект вашей программы. Если Вы используете maven, то можете добавить следующий код в зависимости проекта (выбирайте стабильную версию):
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>3.14</version>
</dependency>
|
или же скачать ее на официальном сайте и вставить вручную.
При работе с библиотекой сразу бросаются в глаза необычные названия классов. Например, в классах для работы с Excel есть префикс HSSF:
HSSFWorkbook
,HSSFSheet
и другие. Этот префикс HSSF расшифровывается как Horrible SpreadSheet Format или в переводе «Ужасный табличный формат»!
Давайте рассмотрим другие классы библиотеки Apache POI:
- Класс
HSSF (Horrible Spreadsheet Format)
используется для считывания и записи файлов Microsoft Excel формата xls. - Класс
XSSF (XML Spreadsheet Format)
используется для считывания и записи файлов в формате Office Open XML (XLSX). - Класс
HPSF (Horrible Property Set Format)
используется работы с базовой информацей о файлах пакета Microsoft Office. - Класс
HWPF (Horrible Word Processor Format)
— для чтения и записи файлов приложения Microsoft Word 97 (формат .doc). - Класс
HSLF (Horrible Slide Layout Format)
— для чтения и записи файлов приложения Microsoft PowerPoint. - Класс
HDGF (Horrible DiaGram Format)
— для чтения и записи файлов приложения Microsoft Visio. - Класс
HPBF (Horrible PuBlisher Format)
используется для работы с файлами Microsoft Publisher. - Класс
HSMF (Horrible Stupid Mail Format)
используется для работы с файлами Microsoft Outlook MSG. - Пакет
DDF (Dreadful Drawing Format)
используется для декодирования формата Microsoft Office Drawing.
Практика по Apache POI
- Здесь подробная статья с примером чтения данных из Excel файла форматов
xls
иxlsx
. - Запись данных в xls файл (создание нового Excel документа).
Комментариев нет:
Отправить комментарий