Перейти к содержимому

MOAB

* * * * * 1 Голосов

Автоматизация для текстов


  • Войдите, чтобы ответить
В теме одно сообщение

#1 azsx

azsx

    Почетный

  • Основатель
  • PipPipPipPipPip
  • 4 598 сообщений
2 876

Отправлено 27 Июль 2017 - 10:51

Есть такая задача. Два каталога, в каждом не более 400 файло docx, odt и pdf (с наложенным текстом). Часть в архивах, часть нет. Каждые несколько месяцев файлы в каталогах целиком меняются. Некоторые по несколько сотен страниц. Надо сделать, чтобы все они становились обычными html. Внезапно!
Я понимаю как их достать из архивов. Вопросы:
1. Как распознать pdf программно или из консоли? Можно виндовой.
2. как конвертировать docx и odt в html с картинками из консоли? Самое ли лучшее ли для этого doctohtml в никс?
зы
Сейчас юзаю не консольные инструменты и всё делаю руками.

#2 protector

protector

    Почетный

  • Основатель
  • PipPipPipPipPip
  • 2 606 сообщений
1 238
  • ИзСанкт-Петербурга

Отправлено 27 Июль 2017 - 12:37

По пункту 2. Я бы копал в эту сторону "конвертирование html в doc на php" - http://volkov-m2.liv...l.com/1535.html

P.S. Точнее нужно обратно ... но суть такая же. Есть классы, которые автоматом делают.




Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 анонимных



© 2017 SMO&SEO форум «WEBIMHO» — продвижение и создание сайтов, интернет-маркетинг

По вопросам рекламы на форуме и цены на рекламу
Все материалы SEO форума разрешены к копированию только с установкой гиперактивной ссылки на webimho.ru,
тем, кто этого не сделает, мы оторвем руки и ноги и поменяем местами,
а когда выйдем из тюрьмы, опять оторвем и опять поменяем.


Россия, г. Москва

Мы в соцсетях: twitter | вконтакте | facebook | livejournal