Pull to refresh

Comments 7

  1. Язык SQL это, вероятно, худший язык для парзинга и анализа строк (и я это говорю несмотря на то, что я SQL нежно люблю)

  2. Сарказм у вас не детектируется никак

  3. В 2023 году во время chatGPT анализ по фразам и словам LIKE %% - это я даже не знаю как это назвать

Это можно назвать ретро стайл.

Но если серьезно, то существует великое множество готовых библиотек с учётом морфологии. GPT это даже овер для таких задач.

В крайнем случае можно прицепить триггер на insert в таблице и дергать по api анализ.

Название статьи - "Анализ сентимента и эмоционального окраса текстов с помощью SQL", содержание статьи - как написать простейшие SQL запросы.

А я надеялся, что расскажут, как с помощью SQL научились определять эмоциональную окраску текста)

Аналогично. Хотя вряд-ли это можно реально хорошо делать с помощью SQL, разве что добавив в SQL функции для тренировки и предсказания, и поддержку tensorflow, как это сделали BigQuery (наверное не только они, но других не пробовал).

Вы могли бы отчасти спасти статью, приложив полное содержимое своей таблицы EmotionDictionary.

Потом, анализ эмоциональной окраски текста просто по словам, так себе идея. Например я несколько лет обнаружил, что "большое спасибо" преимущественно воспринимается отнюдь не как выражение благодарности. Причём это справедливо и для "Thank you very much".

Предложенный способ определения "эмоциональной окраски" напомнил мне один старый анекдот:

Учительница в школе предлагает детям придумать предложение, в котором слово "прекрасно" употребляется дважды. 
- Маша: Вчера папа купил маме прекрасное платье, в котором мама прекрасно выглядела.
- Петя: Моя бабушка готовит прекрасное печенье, которое я прекрасно кушаю.
- Вовочка: Вчера за ужином моя сестра объявила что беременна, а отец сказал: "Прекрасно, блин*, просто прекрасно!"

*не уверен на предмет соответствия оригинального слова правилам ресурса

Ох, я рассчитывал увидеть хотя бы FTS со стеммингом, а не like '%%'

Sign up to leave a comment.