company_banner

Анонс: прямой эфир с Татьяной Ландо, лингвистом-аналитиком Google


    СЕГОДНЯ, в 20:00 в наших соцсетях пройдет прямой эфир с Татьяной Ландо, лингвистом-аналитиком в Google.

    Татьяна работает над Google-ассистентом и занимается проектами между продакшеном и рисерчем. Она исследует, как люди разговаривают друг с другом и какие стратегии используют, чтобы использовать это в обучении ассистента более человеческому поведению. В Google пришла работать над ассистентом для русского рынка и русского языка.

    До этого 8 лет работала в Яндексе. Занималась лингвистическими технологиями, извлечением фактов из неструктурированного текста. Татьяна одна из основателей конфернции AINL: Artificial Intelligence and Natural Language Conference.

    Стрим можно будет посмотреть в любых наших соцсетях — где удобно, там и смотрите.



    О чем Татьяна расскажет:


    • Чем она сейчас занимается
    • Как она пришла в лингвистику и как оказалась в Google
    • Что такое компьютерная лингвистика (и почему не надо спрашивать лингвистов, сколько языков они знают)
    • Основные проекты, которыми она занимается
    • Зачем нужны лингвисты: почему нельзя просто засунуть кучу текста в нейроночку и она не сделает все сама?
    • Почему лингвист в Google — человек в эпицентре разработки голосового помощника
    • Почему с русским работать сложнее чем с английским и при чем тут морфология
    • Как в Google адаптировали англоязычного помощника для работы с русским языком
    • Исследовательский проект, в котором Татьяна сейчас работает: как изучается общение между людьми, чтобы сделать общение с ассистентом более естественным
    • Как научить систему держать контекст и правильно его использовать
    • Какие данные для этого нужно собрать, как их разметить (и нужно ли) для машинного обучения

    Также вы можете задать Татьяне свои вопросы, как в Инстаграме, так и в комментариях в этому посту.



    Куда жать, чтобы не пропустить эфир?


    Жмите на колокольчик на ютубе или подписывайтесь на наш инстаграм, тогда вам придет уведомление о начале эфира.

    Если собираетесь смотреть в записи — подписывайтесь, чтобы не потерять.



    Еще раз напоминаем дату и время: понедельник, 24 августа, 20:00.

    До встречи в эфире!

    RUVDS.com
    VDS/VPS-хостинг. Скидка 10% по коду HABR

    Комментарии 15

      0
      Человек выбрал судьбу. Неадекватными методами клепать вечно сырое приложение. При чем, судя по всему, понимает все это… Ну, да ладно — платят и то хорошо.
        0

        Может быть потому что русский рынок очень мал для Гугла? По этому у нас нифига нет не железа не многих сервисов? На английском языке гугл ассистент очень даже торт

        +1
        Пусть лучше расскажет, почему моя колонка Google Home до сих пор не говорит по-русски.
          +4
          Татьяна воркает над гугл-ассистантом и заингейджена на проджектах между продакшеном и рисерчем.

          Так гораздо лучше. Заодно и понятно, что под русским языком понимают в Гугле.
            +2
            Было бы здорово, чтобы научили писать «по-русски», а не «по русски»
              0
              Научим, куда нам деться
              0

              А Татьяна знакома с «коммуникативным уровнем» русского языка и с перечнем «интонационных конструкций», в нём применяемых? Если нет, то очень рекомендую ознакомиться, это для её работы прям основа, ИМХО.


              https://willie-wonka.livejournal.com/tag/%D0%A1%D0%9A%D0%90%D0%AF

                +1
                Знакома, конечно! Правда системам пока очень далеко до использования таких деталей. Нам бы системы научить простым вещам сначала…
                  0

                  Обычно учёт всяких закономерностей очень упрощает анализ. Если в архитектуру нейросетки закладывать возможность учёта инвариантных значений всяких русских словечек, разбирать компьютером смысл живой речи должно стать проще и эффективнее.

                    +1
                    Всё так. Но до таких деталей и такой вариативности данных еще работать и работать.
                    У нас не везде обучение, даже. Всё еще довольно много ручной работы и правил.
                    Вы слишком хорошо думаете о состоянии ассистентов!
                      0

                      Ну, в правилах подобные вещи отражать ещё проще

                0
                Есть вопрос, давно меня интересующий, и именно лингвистам Google. Но он совершенно не по теме данной статьи — о русском спелл-чекере Гугла. Поскольку те, кто в Гугле ведает этим делом, из норки не показываются, задам-ка я его здесь.
                Итак, начнём. Я не раз ловил гугловский спелл-чекер на неточностях и, если так можно выразиться, «нерусскостях». Пробовал обратиться по этим поводам в техподдержку — ответа не получил.
                1. Кто и как формирует базу данных спелл-чекера? Ведь что туда попало, в ближайшие 10...20 лет устаканится в нашей устной и письменной речи (в силу массовости общения через комп), а ещё через поколение попадёт в академические словари великорусского языка — просто потому, что «так все говорят». Поэтому на этих людях лежит большая ответственность, причём незаметная постороннему взгляду.
                2. В какой мере эта работа поддаётся внешнему контролю — как со стороны простых пользователей, так и академического сообщества?
                3. Каков механизм такого контроля и как им воспользоваться?
                4. (это уже не вопрос) Если такого механизма нет, его стоило бы создать и и распространить информацию о его существовании.
                  0
                  здесь, похоже, вообще не отвечают
                    0
                    Как ни странно, спелл-чекер — это один из тех продуктов, где лингвисты вообще не задействованы. Так что я не смогу прокомментировать «изнутри».
                    Но могу сказать, что у нас стараются делать общие алгоритмы, а различаться по языкам будут только данные. Это не идеальный подход для языков с богатой морфологией, типа русского, отсюда и проблемы с качеством.
                    0
                    Исключение необходимости ручной разметки данных, и при этом система сама будет менять свое состояние, т.е. сделать напрямую связку между данными и изменением системы, — это достигается путем замены Архитектуры, всей применяемой системы алгоритмов машинного обучения. Соотвественно для замены архитектуры системы, следует последовательно пройти путем:
                    Архитектура — Наука — Язык — Смыслы — Мировоззрение — Онтология — Самосознание

                    (Речь о замене архитектуры, это про эту «новую систему», которая была бы «бомбой»).

                    Последовательность, на пути к «Архитектуре AGI».

                    1. «Сознание человека» — это самосознание человека. Сознание человека даётся человеку в форме «недостачи» самого себя, где понятие «недостачи сознания» обретает свой смысл тогда, когда за ним стоит время. Термин «мыслить», как и термин «сознавать», означает не «мыслить о чём», а «мыслить что». Выражение «мыслить что», подразумевает сочетание прямой и обратной временнОй перспективы (миро)видения человеком. Течение времени, как и течение сознания (при функционировании человеческого сознания), предстают в форме циклической смены перспективной и ретроспективной компонент, представленных человеком, с присущими им амплитудами вероятности.
                    Осознанность и неосознанность – это состояния сознания человека.

                    2. «Универсальная Онтология» задает (обуславливает) ВСЕ вероятностные «картины мира» каждого человека, ВСЕХ людей в мире.

                    3. «Картину мира» (мировоззрение) человек сам себе представляет, обосновывая, в первую очередь, смысл своего существования.

                    4. «Смыслы» (что помыслено) — себе представленные человеком феномены, еще до его (человека) с кем либо коммуникации, путем артикуляции или визуализации. Смыслы себе человек представляет образами, и связывает свою визуализацию с ещё им не артикулированными словами языка, и уже артикулирует в своей речи словами языка.

                    5. «Язык» (естественный и искусственный) — знаки (символы), как путь передачи человеком, представленного самому себе смысла. Например, в естественном языке знаки в виде слов. Наличие языка обуславливает науку, включая науки о языке (лингвистика, семиотика и др.)

                    6. «Наука» — осознанная человеческая деятельность, результат которой отображен (представлен) посредством языка (естественного и искусственного), в постулатах, в аксиомах и теоремах, в мнениях и суждениях.
                    Языком отображается «Архитектура AGI».

                    UNIVERSAL ONTOLOGY: www.amazon.com/dp/B08GPHV5SS

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое