Кирилл Данилов (donz_ru) wrote,
Кирилл Данилов
donz_ru

Wiki и HTML

Понадобилось статью, забитую в Mediawiki, превратить в чистый html без викевской обвязки. Я не думал, что это может быть так сложно. Или я чего-то не понимаю. Вот за каким хером создатели wikipedia ещё один формат придумали?! Тупо использовать тот же html или bbcode религия не позволяет?
Нашёл три инструмента (на входе разметка вики, на выходе чистый хтмл)
1)php скрипт - час искал тестовый сервер и просил на него права. Запустил, получил мусор на выходе.
2)perl скрипт - час-два пытался заставить запускаться даже без попытки получить вменяемый результат (я в perl'е ноль, точнее был ноль, сейчас уже 0.1). Запустил, узнал, что скрипт не поддерживает русские буквы
3)Java Wikipedia API Обрадовался. Думал, вот сейчас за пять минут слабаю консольное приложение и вперёд. Ага. Сначала надо добыть документацию. В архиве её нет. Ну думаю, фигня вопрос - javadoc спасёт ОРД. Запустил на один пакет, смотрю на получившееся. Комментариев к методам нет. Ёпт, забыл указать какую-то опцию? Почитал параметры жавадока, запустил ещё раз, натравил на другой пакет. Опа, кое-где проглядывается текст программиста. Кое-где - это примерно к каждому третьему методу и почти к каждому пакету.
Зачем участвовать в семи-восьми сорсфорджовских проектах, если один то до ума довести не можешь? Кому нахер нужна твоя гениальная либа без документации?
Тваю мать, сейчас увидел, что новость о выходе версии 3.0.1 на главной странице проекта устарела. Текущая версия 3.0.4, если заглянуть в download секцию на самом sf.net, а я по ссылкам шёл.
Готовая документация, кстати, тоже есть, но надо покликать несколько раз в каком-то направлении (уже забыл в каком именно).
Код проекта выглядит относительно прилично, так что о действии метода теоретически можно догадаться по его имени и примерам использования, находящимся тоже в нескольких кликах от SourceForge.
Работает это чудо херово. Конец таблицы, например, обязательно должен заканчиваться строкой "\n|}", иначе теряешь весь остаток документа. Узнал в дебаггере, напоровшись на эту чудесную последовательность switch-case'ов. Как ни странно, но именно в этом куске лапши кодер почему-то решил сделать коммент.

Если кто подскажет нормальный инструмент, буду безмерно благодарен. Иначе завтра мне грозит без знания хтмля редактировать то, что получилось после "Save as..." викевской страницы.
Tags: программирование
Subscribe

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments