Pull to refresh

Comments 78

Прапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрапрадед

Модификация в прошлом: протопрапрапрадед.
Модификация в будущем: прапрапробиркапрапрадед.

UFO landed and left these words here

Ааврам сын Еримеи, Еримей сын Иоана, Иоан сын Диохтрия ..... и так далее до ИИсуса

UFO landed and left these words here

родство расматривается только в семи поколениях

Можно ссылку на нормативную документацию?

UFO landed and left these words here
UFO landed and left these words here

тетрагидропиранилциклопентилтетрагидропиридопиридиновыми. 56 букв.

Там есть определённые условия использования, в патенте, вероятно, множественное число не используется. Может там только единственное число для слов считается именно как. рекордное. Ну и если оно итак большое в единственном числе, то множественное число понятно, что будет чуть больше в этом случае.

причем здесь число? у вас в статье "...вые" - это и так множественное число (единственное "...вый".)
baldr изменил падеж

UFO landed and left these words here

а самое длинное слово называется:

"послепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослепослезавтра" - 756 букв.

Так говорят школьники когда откладывают ДЗ на много времени.

И этот день - 1 апреля 2026. Какой точной расчёт!

Кажется, считать химические соединения такое же читерство, как красноречивые сложносоставные матерные слова, можно огромное число букв набрать

Во всяком случае, это реально существующее слово со своим лексическим значением, а не всяческие "прапра...деды" и тому подобные окказионализмы, не упоминаемые нигде, кроме комментариев от интернет-шутников. Та же ситуация, что и с самым большим числом (число Грэма): понятно, что чисел бесконечное множество и можно придумать "число Грэма плюс один", но это реально упоминаемая в математической работе величина. Всё, что больше неё, в таком качестве не упоминается и может быть лишь выдумано искусственно.

Поэтому названия реально существующих химических соединений - валидные примеры. А "прапрадеды" или искусственно выдуманные названия по принципу "в теории такое возможно" - невалидные.

Всё уже украдено до Вас

Чем "прапра<...>прадед" хуже всех этих "тритетрапентагексагептахлорофторобромогидронитроавтомотовелофотогребляебляиохотонаркомминпромзавмагтоваровед"?

Если максимально просто: потому что такого слова нет. Или приведите пример словоупотребления, не связанный с сочинением самых длинных слов.

Если развёрнуто: слово - это лексическая единица, имеющая своё значение, а не просто грамматически корректный набор приставок и суффиксов. "Слово", выдуманное автором в художественных целях - это окказионализм, который может как дорасти до полноценного слова и войти в язык ("миролюбие", "рукопожатный"), так и не войти, оставшись в пределах одного произведения как пример издевательств экспериментов над языком ("мелкоскоп", "вечнодвигателестроитель"). В словари окказионализм не включается, установленного лексического значения не имеет (хотя обычно нетрудно догадаться) и в строгом смысле словом языка не является. Разумеется, окказионализм может быть сколь угодно длинным, пока автору хватает фантазии.

Поэтому названия реально существующих или разрабатываемых химических соединений - это настоящие слова. А "прапрадеды" или вымышленные названия соединений всего подряд, зачастую даже без проверки на химическую корректность, придуманные специально для иллюстрации самых длинных слов - окказионализмы и не считаются.

Если максимально просто: потому что такого слова нет. Или приведите пример словоупотребления, не связанный с сочинением самых длинных слов.

Ну а с какого по счёту добавленного "пра-" такого слова становится нет? "Прадед" есть точно. "Прапрадед" есть? "Прапрапрадеда" уже нет? Какой-нибудь квази-дворянин, ведущий род от Рюрика до наших дней, описывая своё гинекологическое древо, сколько "пра-" может употребить, чтобы слово ещё было? (В первом комментарии под этим постом, там, правда, выйдет даже не от Рюрика, а кто там был где-то в 3 в. н. э. - Гелиогабал, наверное.)

Я, конечно, с одной стороны понимаю вашу аргументацию и не вижу оснований её отвергнуть. Но, даже несмотря на то, что русский язык полон заимствований, считать самым длинным русским словом название пусть даже очень реального химического соединения, состоящее из наколбаса латинских префиксов и корней, имеющих, к тому же, узкоспециализированное применение, и в котором, собственно, "русского" разве что финальное "-овые" кажется курьёзом каким-то.

По идее это же название должно быть и во всех европейских языках. Той же длинны. А может и длиннее.

да не спортивно получается

с помощью искусственного интеллекта определили самое длинное слово в русском языке.

А зачем ИИ? Разве гуглом нельзя было это найти? https://otvet.mail.ru/question/78047104

Теперь официально от уполномоченного института подтвердили.

Это понятно. Но зачем институту понадобился ИИ? Чтобы найти слово, или чтобы посчитать количество букв?

Искать болезнь в интернете должен специалист! (с)

Привет от белков! Белок титин:

https://cw39.com/wp-content/uploads/sites/10/2020/09/longest-word.pdf (английское наименование, кириллицей порядок будет примерно такой же.

Скрытый текст

Метионилтреонилтреонилглутамиларгинилтирозилглутамилсериллеуцилфенилаланилаланилглутамиллеуциллизилглутамиларгиниллизилглутамилглицилаланилфенилаланилвалилпролилфенилаланилвалилтреониллеуцилглициласпартилпролилглицилизолейцилглутамилглутамилсериллеуциллизилизолейциласпартилтреониллеуцилизолейцилглутамилаланилглицилаланиласпартилаланиллеуцилглутамиллеуцилглицилизолейцилпролилфенилаланилсериласпартилпролиллеуцилаланиласпартилглицилпролилтреонилизолейцилглутамиласпарагинилаланилтреониллеуциларгинилаланилфенилаланилаланилаланилглицилвалилтреонилпролилаланилглутамилцистеинилфенилаланилглутамилметиллеуцилаланиллеуцилизолейциларгинилглутамиллизилгистидилпролилтреонилизолейцилпролилизолейцилглициллеуциллеуцилметилтирозилаланиласпарагиниллеуцилвалилфенилаланиласпарагиниллизилглицилизолейциласпартилглутамилфенилаланилтирозилаланилглутамилцистеинилглутамиллизилвалилглицилвалиласпартилсерилвалиллеуцилвалилаланиласпартилвалилпролилвалилглутамилглутамилсерилаланилпролилфенилаланиларгинилглутамилаланилаланиллеуциларгинилгистидиласпарагинилвалилаланилпроли... и так далее на протяжении еще примерно 189 600 букв

Ой, какая же жесть. Мое сердце хемоинформатика просто кровью обливается. Во-первых, таких названий химических соединений можно нагенерировать бесконечное количество.

Во-вторых,

Тетрагидропиранилциклопентилтетрагидропиридопиридиновые — это название химического соединения, которое упоминается в одном из патентов.

Это не название соединения, а название класса соединений. Для химиков, особенно хемоинформатиков разница принципиальная. Если вы цифровизируйте химические патенты, например, эту запись невозможно распарсить в одну из стандартных химических нотаций, типа SMILES. И вот тут начинаются реальные проблемы и задачи...

В-третьих, непонятно по каким критериям они вывели из игры названия химических соединений с дефисами и цифрами. Как ни крути -- это "сложные слова", то есть вполне должны быть в списке. А они уделают Тетрагидропиранилциклопентилтетрагидропиридопиридиновых -- совершенно спокойно

То есть ИИ нашёл слово, а химики нашли проблему в том, что оно вообще слово. Баланс соблюдён

Взяли и верстку на православном Дзене сломали своими самыми-самыми словами 😁

Скрытый текст
тетрагидропиранилциклопентилтетрагидропиридопиридиновые
тетрагидропиранилциклопентилтетрагидропиридопиридиновые

Не только на Дзене.

На РБК и в "поиск с ИИ" в Google текст уезжает за пределы экрана, без переноса.

Когда нет естественного интеллекта отсортировать список слов по длине - применяют искуственный. Днище...

Это всё-таки не просто сортировка, а поиск в корпусе и фильтрация по морфологии. Не так примитивно, как кажется

ага, когда я делал что-то по типу алгоритма для нахождения такого слова (ну, GUI, менюшки, понимайте, нужно же высчитывать чтобы x и y были не как попало, а тем более на SSD1306) то мне даже тестировать не нужно было. сразу заработало.

тетрагидропиранилциклопентилтетрагидропиридопиридинового

найди самое длинное русское слово, не составное из других слов

Ответ deepseek:

Отличный вопрос! Ответ на него зависит от того, что считать «составным» и «словом».

Если брать за основу строгий лингвистический подход (слово, не являющееся сложносоставным, то есть не образованное из двух или более корней), то самым длинным словом русского языка, внесённым в основные словари, считается:

ДЕЛОПРОИЗВОДИТЕЛЬНИЦА

(21 буква)

· Что означает: Женщина-делопроизводитель.
· Почему оно не составное: Оно образовано не сложением основ (как, например, «водогрязеторфопарафинолечение»), а последовательным добавлением суффиксов и окончания к корню «-дел-»:
· дело → деловой → делопроизводство → делопроизводитель → делопроизводительница.

Это слово зафиксировано в словарях и является цельной лексической единицей.

Другие претенденты и нюансы

Если немного ослабить критерии, появляются другие интересные кандидаты:

  1. «ПРЕВЫСОКОМНОГОРАССМОТРИТЕЛЬСТВУЮЩИЙ» (35 букв) · Это слово, придуманное Гоголем для сатирического описания бюрократии. Оно является окказионализмом (словом, созданным для конкретного случая) и в обычные словари не входит, но известно в литературе.

  2. «ЧЕЛОВЕКОНЕНАВИСТНИЧЕСТВО» (23 буквы) · Хотя оно содержит в себе корень «человек», с лингвистической точки зрения это не классическое сложное слово (типа «пароход»), а слово, образованное от готовой основы «человеконенавистник» с помощью суффикса «-еств-». Оно зафиксировано в словарях и считается цельным.

  3. «ВОДОГРЯЗЕТОРФОПАРАФИНОЛЕЧЕНИЕ» (29 букв) и «ЭЛЕКТРОФОТОПОЛУПРОВОДНИКОВЫЙ» (28 букв) · Это уже классические примеры сложносоставных слов, которые явно образованы из нескольких корней. По вашим критериям они не подходят, но часто фигурируют в списках самых длинных слов.

Короткий итог:

· Самое длинное «стандартное» слово из словаря: делопроизводительница (21 буква).
· Самое длинное известное слово (окказионализм): превысокомногорассмотрительствующий (35 букв).
· Частые, но составные чемпионы: водогрязеторфопарафинолечение (29 букв) и подобные им.

Если брать за основу строгий лингвистический подход (слово, не являющееся сложносоставным, то есть не образованное из двух или более корней), то самым длинным словом русского языка, внесённым в основные словари, считается:

ДЕЛОПРОИЗВОДИТЕЛЬНИЦА

Ваш дикпик опять набредил. «делопроизводитель[ница]» — это

Корень: -дел-; интерфикс: -о-; корень: -производ-; суффиксы: -и-тель

(Тихонов А. Н. Морфемно-орфографический словарь. — М. : Школа-Пресс, 1996. — 701,[1] с. — ISBN 5-88527-119-4) — https://www.slovorod.ru/der-tikhonov/tih-d.htm

Не надо нам тут лохматить бабушку. Тут, знаете ли, ещё не перевелись (пока что) старые википедики, которые в источники умеют, а не принимают на веру наукообразные глюки предсказателя следующего токена.

Да, вы правы, тут не только у дипсика, но и у меня случилось затмение)))

А вы в курсе про самую бесполезную\неоплачиваемую профессию?

Интрига?

Это комментатор Хабра. И я конечно же в их числе

я конечно же в их числе

We are all mad here ©

А вы точно понимаете что означает слово "профессия"?

В Интернете везде-везде написаны варианты вот такого утверждения:

Сложносоставное слово – это сложное наименование, состоящее из двух слов, соединенных дефисом. Например: телефон-автомат, гриль-бар, кресло-качалка, музей-квартира, генерал-лейтенант.

Слово "делопроизводительница" сюда точно не подходит, так что это DeepSeek умеет докапываться до формулировки лучше, чем вы.

LLM вам может ответить только о чём на эту тему пишут в Интернете. Абсолютную истину обещает только марьванна.

Вопрос: Какое слово в русском языке является самым длинным, при этом не является сложным?

Портянка

Однозначного ответа на этот вопрос нет, так как многое зависит от критериев (например, включать ли редкие, устаревшие или узкоспециальные слова). Однако если говорить о самых длинных не составных (не сложенных из нескольких основ) словах, которые можно встретить в обычной речи, то обычно приводят следующие варианты:

  1. «Переосвидетельствоваться» (24 буквы)
    Что означает: пройти повторное освидетельствование.
    Особенность: глагол, образованный суффиксальным способом, не является сложным словом.

  2. «Субстанционализироваться» (23 буквы)
    Что означает: философский термин, придать чему-либо статус субстанции.

  3. «Интернационализироваться» (22 буквы)
    Что означает: стать международным.

  4. «Высокопревосходительство» (24 буквы)
    Что означает: титул, обращение к чиновнику высшего ранга в дореволюционной России.

Если исключать узкоспециальные и устаревшие слова, то «переосвидетельствоваться» — один из самых длинных «живых» и грамматически не составных слов в русском языке.

«Субстанционализироваться» (23 буквы)

«Интернационализироваться» (22 буквы)

Ah sh**, here we go again.

Я вообще удивляюсь, как LLM может хотя бы примерно посчитать буквы в тексте. Он же внутри думает токенами, причём эта думалка не знает как токены обратно превратятся в текст. Он должен быть в принципе не способен отвечать на такие вопросы, а вот как-то иногда справляется.

Известно ж как: оно говорит то, что до него в аналогичных ситуациях (то есть когда предшествуие токены были такими же) говорили человеки.

Попросите LLM сочинить стихотворение или там песню на тему недавней поездки Трампа в Китай и договора о таможенных сборах и редкоземельных элементов. Он вам там что-то придумает.

Какие человеки в каких аналогичных ситуациях говорили такое? Где LLM нашёл эту информацию?

Попросите LLM сочинить стихотворение или там песню

Вот Вы сейчас всей ступнёй оттоптались по больным мозолям всех LLMок, потому как со стихосложением (ну там, рифма, ритм, размер) — такой карагандец, что святых можно вагонами выносить. «Стихи» получаются приснопамятного уровня «я поэт, зовусь Незнайка, от меня вам всем приветик» (в лучшем случае — «балалайка»).

Какие человеки в каких аналогичных ситуациях говорили такое?

Чуть менее чем всегда через какое‑то время после токенов «Тра‑мп» люди использовали токены «ре‑спу‑бл‑ика‑н...» («G‑O-P», «M‑A-G‑A», «с‑л‑о‑н», «к‑р-а‑с-н» и тому подобное). Никто не говорит, что ровно те же токены должны быть использованы в том же порядке: вопрос чисто в вероятностях их дальнейшего появления. Например, впероятность появления после токенов «зе‑лё‑ный» токенов «ли‑с-т» велика, а токенов «ще‑но‑к» пренебрежительно мала. Учите матчасть уже наконец.

Где LLM нашёл эту информацию?

А то Вы не знаете, что все LLMки натренированы преимущественно на текстах, взятых из Интернета.

«Стихи» получаются приснопамятного уровня «я поэт, зовусь Незнайка, от меня вам всем приветик» (в лучшем случае — «балалайка»).

Какая разница? В данном контексте главное что получаются.

Чуть менее чем всегда через какое‑то время после токенов «Тра‑мп» люди использовали токены «ре‑спу‑бл‑ика‑н...»

И что? В каких аналогичных ситуациях люди сочиняли стихи на вышеозвученную тему?

Никто не говорит, что ровно те же токены должны быть использованы в том же порядке: вопрос чисто в вероятностях их дальнейшего появления.

Ну так как из одних и тех же вероятностей получаются разные стихи на разные темы?

А то Вы не знаете, что все LLMки натренированы преимущественно на текстах, взятых из Интернета.

Замечательно. Ссылочку не дадите. Ну на текст с вышеозвученным содержанием?

Какая разница? В данном контексте главное что получаются.

Знаете, Вы мне сейчас сына из приснопамятного анекдота напоминаете. Я Вам только что десять минут пытался объяснить, что не стихи, а хрень на постном масле — а Вы мне ту же шарманку по второму кругу заводите.

Ну так как из одних и тех же вероятностей получаются разные стихи на разные темы?

Предлагаете мне в очередной раз рассказать Вам про температуру?

Ну на текст с вышеозвученным содержанием?

Знаете, мне практически невозможно отделаться от чувства, что у нас идёт один‑в-один разговор из анекдота про море. Речь идёт не о ТОЧНОМ повторении текста, а о вероятностях выбора очередных токенов. Понимаете? Ве‑ро‑ят‑но‑стях! «Если в предыдущем предложении было „Тр‑амп“, то в этом предложении увеличена вероятность токенов „ре‑сп“...»

Я Вам только что десять минут пытался объяснить, что не стихи, а хрень на постном масле

А мне и не важно стихи это или нет. Важно что это новый текст и ничего такого люди до этого не писали. Ну или как минимум в интернете не постили в тот момент когда ИИ обучался.

Предлагаете мне в очередной раз рассказать Вам про температуру?

Нет. Предлагаю вам ответить на вопрос.

Так как из одних и тех же вероятностей получаются разные тексты и при этом ещё и на нужную тему?

Речь идёт не о ТОЧНОМ повторении текста, а о вероятностях выбора очередных токенов.

Ну так ещё раз вероятности то одни и те же. Но если просить писать стихи про Трампа с разными сюжетами, то это работает.

По вашему объявлению каждый раз должен просто какой-то рэндом выходить.

Так как из одних и тех же вероятностей получаются разные тексты и при этом ещё и на нужную тему?

(Уже устало но всё ещё терпеливо:) Потому что каждый следующий токен побдирается случайно, но с вероятностью, зависящей от предыдущих. Если предыдущими токенами были «он подошёл к опушке и увидел зелёный л...» то следующим токеном может с близкими вероятностями быть как «...ес», так и «...ист»; однако в случае «...подобрал зелёный л...» верятности «...ист» будет сильно больше, чем «...ес».

Ну так ещё раз вероятности то одни и те же. Но если просить писать стихи про Трампа с разными сюжетами, то это работает.

Если «с разными сюжетами», то и вероятности будут разные, потому что они зависят от предыдущих токенов — в том числе и от токенов «Напиши стихи про Трампа и...»

По вашему объявлению каждый раз должен просто какой-то рэндом выходить.

Так он и выходит.

Потому что каждый следующий токен побдирается случайно, но с вероятностью, зависящей от предыдущих

Так откуда берутся вероятности конкретно для описаного выше стиха?

Так он и выходит.

Нет. Выходит что-то в тему. А это не просто рэндом и всё.

Так откуда берутся вероятности конкретно для описаного выше стиха?

Путём перемножения большого числа огромных матриц, которые, собственно, и являются «мозгом» LLM.

Нет. Выходит что‑то в тему.

Ещё раз. «В тему» оно выходит, потому что вероятность токенов «республиканец, MAGA, мексы, мигранты» и тому подобное после токенов «про Трампа» получается выше.

У нас реально сейчас получается диалог папы и сына про море. Почитайте матчасть, ну хоть немножко.

. «В тему» оно выходит, потому что вероятность токенов «республиканец, MAGA, мексы, мигранты» и тому подобное после токенов «про Трампа» получается выше.

Вот именно. Выше вероятность токенов про "республиканец, MAGA, мексы, мигранты» и тому подобное", а пишет он всё равно про китайцев и редкоземельные элементы.

А по вашей логике он должен писать именно то, про что вероятности выше.

Почитайте матчасть,

У меня нет проблем с матчастью. У меня проблемы с тем как вы её интерпретируете и обьясняете :)

а пишет он всё равно про китайцев и редкоземельные элементы.

Ну Вы же в начале запроса сами написали про «напиши про визит Трампа в Китай»!!! Вот вероятности, связанные с «китайцами» и «редкоземельными элементами» и выросли!

Так откуда он знает какие самые вероятные последовательности слов для этого запроса если до этого никто ничего такого не писал и в его выборке для обучения этого не было?

ЧЕГО не было? Что, редкозём в Китае вчера появился, что ли?

Трамп в Китае вчера появился чтобы редкозёмы обсуждать.

И... что тут удивительного? Что конкретного в этом Вашем, прости Саган, «стихотворении» такого, что не может быть «собрано» из кусочков? «Китай», «Трамп», «переговоры» и «редкозёмы» (по отдельности) в Интернете обсуждались сильно раньше, чем «вчера» — а скомбинировать всё это никаких проблем нет: какие слова в запросе встретились — под такие токены и подобрались.

Слово «делопроизводительница» сюда точно не подходит, так что это DeepSeek умеет докапываться до формулировки лучше, чем вы.

Скажите, пожалуйста: у Вас со зрением проблемы, или с кратковременной памятью?

Видите там жирненьким выделенное? Дяденька Тихонов говорит нам, что в слове «Делопроизводительница» немножко более одного корня, так что оно никак не может служить примером «слова, не образованного из двух или более корней». После этого, как в том анекдоте («— Почему вы сдали крепость? — На то есть много причин. Во‑первых, у нас не было пороха...») всё остальное немного вторично.

А теперь такой же рисуночек вот здесь, пожалуйста.

«ЧЕЛОВЕКОНЕНАВИСТНИЧЕСТВО» (23 буквы) 

Там 24 буквы...

Да, вы правы, нужно было посчитать. Хотя оно тоже из 2 корней и поэтому не проходит.

Чем сложнее структура, тем длиннее слово. А ещё всё это абсолютно бессмысленно вне контекста патента

Это слово иностранного происхождения, не русское.

Вспоминается эпизод чгк с дискуссий про мясо, просо и серсо, породившее дискуссии филологии о том, что мы считаем за русские слова. Если кратко, то исконно русских слов сравнительно немного и если покопаться, то многие привычные нам слова произошли от латинского, греческого, моногольского или иных языков. В общем вопрос исконно русских слов крайне зыбкий и каждый филолог ответит на него по своему.

https://newlit.ru/~zapiski_o_yazyke/5661.html

можетвытамделомзайметесьвместопоискавсякойфигни

Если можно тетрагидропиранилциклопентилтетрагидропиридопиридиновыми, то я придумаю новую формулу и сделаю новый рекорд:

гентетраконтагидропиранилциклопентилтетрагидропиридопиридиновыми.

Надо поставить памятник...

А однострочником на Питоне, Баше и чём угодно нельзя было найти самое длинное слово в русском языке?

И как правильно заметили - слов длиннее можно нагенерировать сколько угодно. Это показатель профнепригодности всех этих пушкинистов? А теперь им ещё и ИИ установили, они же не понимают что это за штука, они же будут верить каждому слову и писать по этому научные труды!.

Несколько лет назад задался вопросом про самое длинное отдельное слово, без всяких сочетаний многокоренных. Нашёл только упомянутое выше переосвидетельствование (как начальную форму существительного без искажений; всё таки образованные глаголы и прилагательные от него - это уже немного читерство). Его можно только немного удлинить, если читерски поменять форму, - самый длинный вариант получится на 28 букв: непереосвидетельствовавшийся. Длиннее ничего больше не встречал.

недопереосвидетельствовавшийся

Так человек в очередной раз победил машину.

Фирменный магазин мясокомбината.
— А из чего вашу колбасу делают?
— Не скажу.
— Почему?
— Чтобы это выговорить, надо лет пять на химическом факультете учиться.

Sign up to leave a comment.

Other news