Pull to refresh
  • by relevance
  • by date
  • by rating

.xlsx на службе оператора баз данных

Lumber room
Уважаемые хабражители!

Взываю о помощи. Ситуация следующая, имеется некоторая база (таблица), которую надо вручную обработать человеку (на данный момент там около 50 тыс строк), но компьютер который ему предоставлен для обработки открывает .xls минут 5 чистого времени, поэтому т.к. обработка возможна только в Office 2007, решили не гнаться за форматом и пересохранили в .xlsx, в результате чего размер файла сократился с 30 до 10 мегабайт. Но все равно медленно и долго.

Что еще можно отключить/пересохранить/предпринять, чтобы не так тормозно было? Просьба OpenOffice не предлагать, т.к. там нет таких фильтров как в 2007 офисе.
Total votes 6: ↑1 and ↓5 -4
Views 286
Comments 19

Поддержка .xlsx и .docx в Google Docs

IT-companies
В Google Docs добавлена одна из самых ожидаемых функций — поддержка форматов MS Office 2007, а именно .xlsx и .docx. Они появились в списке поддерживаемых форматов, который уже включает в себя .doc, .odt, xls, .ods, .ppt, .csv, .html, .txt, .rtf и другие.



Импорт документов в новомодных форматов происходит стандартным образом, через меню “Upload”. Система сама определит формат документа и импортирует его в базу с сохранением всего форматирования.



Если нужно конвертировать сотни/тысячи файлов, то это можно сделать с помощью Google Documents List API.

via Google Docs Blog
Total votes 55: ↑48 and ↓7 +41
Views 2.4K
Comments 31

Генерируем OfficeOpenXML-документы за 5 минут

.NET *
Часто надо бывает из приложения на ASP.NET сгенерировать отчёт на сервере в OpenXML-формате.

Есть несколько привычных способов сделать это:
  1. «Нашёл, слинковал, заюзал» – идём в Гугл, ищем библиотеку для генерации docx или xlsx, подключаем, разбираемся, генерируем. Это привычно, но долго.
  2. «Фу» – использовать COM. Это не рекомендуется, требует установленного Microsoft Office на сервере, не очень thread-safe, с x64 не дружит и вообще старомодно.
  3. «Ъ» – разобраться с форматом, собрать из XML и зазипать. Брутально.
  4. «Microsoft way» – об этом способе рассказывается под катом.

Читать дальше →
Total votes 71: ↑63 and ↓8 +55
Views 65K
Comments 31

Как сделать онлайн просмотр документов

LLC Tik-Tok Coach corporate blog Website development *
Tutorial
Первый рабочий день. Первая задача в Redmine. Первая спецификация в формате doc. На новой рабочей машине. К чтению спецификации удалось приступить часа через 3. Пока скачался и установился MS Office. Вспоминая этот случай, я был уверен, что в нашей системе управления задачами надо сделать онлайн просмотр документов. Вот только идей по реализации за разумное время и трудозатраты не было. Недавно мы нашли способ – Microsoft Office Web Apps.

В этой статье пойдет речь о том, как добавить онлайн просмотр документов в любой продукт.
Читать дальше →
Total votes 18: ↑15 and ↓3 +12
Views 47K
Comments 36

Читаем XLSX на Android при помощи Apache POI

Development for Android *
UPD (06.09.2014): Больше нет необходимости компилировать с опцией --core-library
poi logoСама по себе задача прочитать формат XLSX при помощи Apache POI XSSF совершенно не хитрая. Не хитрая ровно до тех пор, пока вы не решите подключить эту библиотеку к вашему приложению для Android. К сожалению, гугление ни к чему не привело — мне не удалось найти реальных инструкций или рекомендаций по использованию XSSF на Android. Вообще ни одного упоминания о том, что эта библиотека действительно может работать на Android.

HSSF(XLS) — работает без проблем, XSSF(XLSX) — не удалось ничего найти, только рекомендации обрабатывать все при помощи POI где-нибудь на сервере.

Далее раскрываю, в чем заключается проблема и как я её решил
так сказать, свидетельство того, что XSSF на Android работать может
Total votes 14: ↑11 and ↓3 +8
Views 8.4K
Comments 2

Простой экспорт в Excel XLSX

PHP *Yii *
В продолжение темы, начатой в предыдущей статье, хочу поделиться своим опытом экспорта данных, в частности, в формате XLSX.



Итак, кому интересно, как заполнить XLSX без больших и сложных библиотек, прошу под кат.
Читать дальше →
Total votes 13: ↑12 and ↓1 +11
Views 41K
Comments 17

Простой план-фактный анализ в Power BI Desktop. Часть первая – консолидация и очистка данных

Data Mining *Data visualization
Sandbox
Tutorial
UPD: Обновил публикации в связи с выходом Power BI Desktop из стадии Preview 24 июля.

Сегодня хочу рассказать про построение простого дашборда с план-фактным анализом доходов и расходов в Power BI Desktop и Power BI. В первой части рассмотрим работу с запросами, научимся объединять данные из нескольких источников и выполнять их очистку.

Исходные данные: несколько файлов Excel в которых хранится информация о показателях доходов и расходов компании за некоторое время. Поскольку форма отчетов и статьи учета несколько раз менялись, то листы с информацией имеют похожую, но не совсем одинаковую структуру. На выходе требуется получить нечто, что позволит руководителям получить представление о том, что происходит с финансами компании
Давайте посмотрим, как Power BI Desktop позволит объединить данные и их визуализировать.

Стартовое окно Power BI Desktop
Рисунок 1. Стартовое окно Power BI Desktop

Читать дальше →
Total votes 8: ↑8 and ↓0 +8
Views 32K
Comments 2

Office как Платформа, выпуск №2: Power BI – новый подход к созданию бизнес-аналитики

Microsoft corporate blog Big Data *Open data *Data visualization Development for Office 365 *


На сегодняшний день, одной из важных задач, с которыми мы сталкиваемся в процессе работы, является задача правильного и красивого предоставления данных. Мы стремимся превратить безликие цифры в интересные и информативные материалы, оживить свои отчеты и презентации. Более того, объем данных, поступаемых в мозг человека, увеличивается с каждым годом, поэтому, наряду с получением любых результатов нам необходимо правильно их обработать и структурировать.

Сегодня, на примере ряда задач, мы с вами рассмотрим мощный облачный инструмент, который позволяет создавать различные яркие и красочные отчеты на основе огромного числа источников данных. А именно, спешу поделиться с вами новым инструментом, который поможет вам визуализировать ваши данные – Power BI.
Читать дальше →
Total votes 19: ↑18 and ↓1 +17
Views 47K
Comments 17

Конвертация многостраничного xls/xslx в csv при помощи PHPExcel

PHP *
Sandbox
В моих проектах часто нужно было собирать данные из разных источников в CSV формат, и пока не нужно было получать данные из нескольких страниц таблиц xls, мне хватало простого fgetcsv() / fputcsv(). Но вот наступил всё-таки тот день, когда передо мной была поставленна задача «получать данные со всех страниц документа». И, как водится, я начал искать готовое решение, чтобы не строить свой «велосипед». Но, к сожалению, именно того, что мне нужно было, я не нашёл: было похожее решение, которое выводило многостраничный документ на экран, но использовалась другая библиотека, которая, как я понял, не поддерживала формат xslx (Excel 2007 +). Ещё немного поискав другие варианты, я понял, что дело гиблое и решил разобраться с библиотекой самостоятельно. Совместив некоторые подсказки по работе с библиотекой PHPExcel в одно целое, я получил следующий скрипт. Итак, приступим.
Читать дальше →
Total votes 18: ↑12 and ↓6 +6
Views 16K
Comments 11

Парсер OOXML (docx, xlsx, pptx) на Ruby: наши ошибки и находки

ONLYOFFICE corporate blog Open source *Ruby *XML *Web services testing *
Мы выложили парсер OOXML форматов на Ruby в open-source. Он доступен на GitHub'е и RubyGems.org, бесплатен и распространяется под лицензией AGPLv3. Всё как у модненьких Ruby-разработчиков.


Читать дальше →
Total votes 20: ↑19 and ↓1 +18
Views 7.6K
Comments 6

Открытый урок «Пишем свою библиотеку для работы с xlsx файлами»

OTUS corporate blog Python *Programming *
И снова здравствуйте! Небольшой открытый урок в рамках курса «Web-разработчик на Python», на котором преподаватель курса Илья Лебедев рассказывал как устроен формат xlsx, как с ним работать без специализированных библиотек, вроде openpyxl и показал как разработать свою библиотеку для работы с этим форматом с нужным набором функций.



Если есть вопросы\комментарии, то их можно задать здесь или зайти к Илье на день открытых дверей.
Total votes 23: ↑21 and ↓2 +19
Views 5.8K
Comments 1

Конвертация текстовых документов в xml на С#

.NET *C# *
Sandbox
Tutorial

Недавно мне пришлось столкнуться с необходимостью достать текст из офисных документов (docx, xlsx, rtf, doc, xls, odt и ods). Задача осложнялась требованием представить текст в формате xml без мусора с максимально удобной для дальнейшего парсинга структурой.


Решение использовать Interop сразу отпало по причине его громоздкости, во многом избыточности, а также необходимости устанавливать на сервер MS Office. В результате, решение было найдено и воплощено на внутреннем проекте. Однако, поиск оказался настолько сложен и не тривиален в силу отсутствия каких-либо общедоступных мануалов, что мной было принято решение написать в свободное от работы время библиотеку, которая решала бы указанную задачу, а также создать написать что-то вроде инструкции, чтобы разработчики прочитав ее смогли, хотя бы поверхностно, разобраться в вопросе.


Прежде, чем перейти к описанию найденного решения, предлагаю ознакомиться с некоторыми выводами, которые были сделаны в результате моих изысканий:


  1. Для платформы .Net не существует какого-либо готового решения для работы со всеми перечисленными форматами, что заставит нас местами кастылизовывать наш солюшн.
  2. Не пытайтесь в сети найти хороший мануал по работе с Microsoft OpenXML: чтобы разобраться с этой библиотекой придется изрядно покрасноглазить, покурить StackOverflow и поиграться с отладчиком.
  3. Да, мне все таки, удалось приручить дракона.

Сразу оговорюсь, что в настоящий момент библиотека еще не готова, но она активно пишется (на столько, на сколько это позволяет свободное время). Предполагается, что будут написаны отдельные посты для каждого формата и параллельно, вместе с их публикацией, будет обновляться репозиторий на гитхабе, откуда можно будет получить исходники.


Работа с xlsx и docx

Читать дальше →
Total votes 25: ↑23 and ↓2 +21
Views 11K
Comments 32

Конвертация xls в xlsx и xml на C#

.NET *C# *Development for Office 365 *
Tutorial

В этой статье я постараюсь рассказать об одном из возможных путей конвертации документов формата xls в xml.


Непосредственно моя задача выглядела примерно так:


Дано:


  1. 1-2 дня времени на поиск и реализацию решения
  2. Найденное решение должно быть настолько бесплатным, насколько это возможно
  3. Известна примерная структура, размер и содержание файла, которые должны быть обработаны, что снимает необходимость читать графики, диаграммы и иные медианные из документа.
  4. Использовать Interop, равно как и иные библиотеки, которые требуют установки Office нельзя, так как это создает лишнюю нагрузку на сервер и требует дополнительной установки офисного пакета.
Читать дальше →
Total votes 17: ↑13 and ↓4 +9
Views 10K
Comments 19

О небольших, но бесяще важных различиях текстовых редакторов

Р7-Офис corporate blog Typography *Project management *Software

Привет! Я из команды «Р7-Офис», и я немного гик текстового редактирования. Например, в MS Word, равно как и в нашем редакторе Р7, есть двойное зачёркивание, а вот в других русских офисах такой фичи «из коробки» нет. На самом деле это очень русская фишка: у нас есть госкомпании, которые по своим стандартам должны использовать именно двойное зачёркивание в ряде ситуаций. И если эту функцию не поддерживать, то где-то далеко в Сибири заплачет ещё один инженер. 

У нас нет разницы между ядрами онлайн-редактора и десктопной версией. У большинства офисных пакетов эволюция прослеживается с тех времён, когда никакого онлайна толком не было, и внутри монолита можно было построить Римскую империю. Поэтому при переходе к онлайну они обычно не трогали старую кодовую базу, а просто выписывали её основные свойства в бэклог и повторяли в новой версии. Как метод рефакторинга подход замечательный, если не считать того, что полностью скопировать исходный функционал не всегда получается (и не всегда экономически оправданно, видимо), и в итоге приходится поддерживать два разных продукта, которые нередко для пользователя выглядят как один. 

Но я бы хотел рассказать немного о буднях того, что происходит в «исконно славянском труЪ офисе». Начнём с подхода к открытию и сохранению docx и плавно перейдём к тому, каких функций вам не хватает. 

Читать далее
Total votes 33: ↑32 and ↓1 +31
Views 7.6K
Comments 23