daniilshat Sep 20 2024 at 11:11

Разработчики представили Reader-LM — языковую модель для конвертации HTML в Markdown

1 min

6.9K

Artificial IntelligenceMachine learning * HTML *

Comments 9

NeonMercury Sep 20 2024 at 11:56

Зачем? html и markdown довольно совместимые друг с другом форматы, они и обычным алгоритмом будут конвертироваться ничуть не хуже

erydit Sep 20 2024 at 12:11

Денег не дадут, если в проекте не будут упоминаться волшебные слова "искусственный интеллект", "машинное обучение", "нейросети".

UFO landed and left these words here

Kahelman Sep 20 2024 at 16:07

Кидайте ссылку на Иранику. Проварим что из неё обычным плагином для Firefox можно будет вытащить потом бы, конечно сравнить с результатом модели.

Проблема модели в том что не ясно что она вам вытащить. Она же не гарантирует 1-1 воспроизведение.
И скорее всего если вы ее несколько раз на те же данные запустите то разный результат получите. Он конечно прикольно но работает с этим тяжело.

zartdinov Sep 20 2024 at 13:20

Извлечение информации не тривиальная задача, достаточно посмотреть исходный код любой страницы. Автоматом конвертнуть можно, наверное, но 90% из этого всякий мусор для разметки и рекламы.

UFO landed and left these words here

MainEditor0 Sep 20 2024 at 14:53

Погодите, а разве конвертеры на основе классических подходов к разработке софта не существуют уже со времен динозавров?

Kahelman Sep 20 2024 at 16:02

Вы от жизни отстали. Теперь если приложение то на electron, если обработка текстового файла то на LLM.
Куда ещё мощности процессоров девать-то?

UFO landed and left these words here