Как стать автором
Обновить
2
0

Пользователь

Отправить сообщение

Первые агенты для самообучения сильного ИИ

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров16K

Тысячи учёных, программистов и просто энтузиастов по всему миру сейчас со всех сторон стараются подойти к главному изобретению в истории человечества, если оно будет сделано — это сильный ИИ (AGI, artificial general intelligence).

Один из подходов к созданию AGI — самообучение так называемых агентов, то есть автономных систем, способных найти решение для произвольных задач и улучшать его до бесконечности. Результаты первых экспериментов интересные.
Читать дальше →
Всего голосов 54: ↑54 и ↓0+54
Комментарии27

Первый опыт работы с ChatGPT с примером

Время на прочтение2 мин
Количество просмотров12K

В процессе сотрудничества с одним из новостных порталов была озвучена задача генерации осмысленного текста по наборам тезисов. Это увеличивает время пребывания пользователей на сайте, что, в свою очередь, привлекает рекламодателей. Для этой цели воспользовались общедоступной версией ChatGPT от OpenAI.

Читать далее
Всего голосов 6: ↑4 и ↓2+2
Комментарии24

Искусственный Интеллект. Самообучение играм на победу на примере «Крестики-Нолики»

Время на прочтение51 мин
Количество просмотров4K

Если робот сыграет сам с собою много-много партий, то сам научится хорошо играть.
Вот такую гипотезу мы сформулировали для обучения робота.

И это сработало (!)

За 100 секунд робот сыграл сам с собой 100 000 партий в "Крестики-Нолики" и теперь во время игры с оппонентом просто достает из памяти «лучший» ход.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии2

Мозг. Как он работает

Время на прочтение8 мин
Количество просмотров15K

Хочу поделиться в блоге ЛАНИТ впечатлениями о книге нейробиолога, профессора Стенфордского университета Дэвида Иглмена «Живой мозг. Удивительные факты о нейропластичности и возможностях мозга» (Москва, «Манн, Иванов и Фербер», 2022). Книга читается легко, она не содержит «страшных» медицинских терминов, которые могли бы отпугнуть читателя, и в то же время достаточно убедительно разъясняет природу мышления и причину довольно сложных случаев отклонений от нормального развития мозга.

Читать далее
Всего голосов 99: ↑98 и ↓1+97
Комментарии29

ТВ вместо монитора: HDR, 120 Гц и вот это всё

Уровень сложностиПростой
Время на прочтение20 мин
Количество просмотров85K

Разбираемся, зачем экранам 500 Гц, почему телевизор не монитор, за сколько часов выгорит OLED и как вообще это всё работает.

Читать далее
Всего голосов 170: ↑170 и ↓0+170
Комментарии418

Создание ботов для торговли криптовалютами и акциями на Postgres

Время на прочтение22 мин
Количество просмотров37K

Создание надежных ботов и эмуляторов для торговли акциями и криптовалютой управляемый через телеграмм на базе Postgresql с использованием только pgsql.

Читать далее
Всего голосов 19: ↑19 и ↓0+19
Комментарии12

Разработка первого проекта на платформе Microsoft Dynamics 365 For Finance and Operations

Время на прочтение9 мин
Количество просмотров7.6K
Всем привет! Меня зовут Таня, я тимлид группы разработки Axapta в компании Lamoda. В этой статье речь пойдет про разработку нашего первого проекта на платформе Microsoft Dynamics 365 For Finance and Operations.

image

Я расскажу про подходы, которые мы использовали, про ошибки, которые допускали, поделюсь знаниями и приобретенным опытом. Эта статья может быть интересна тем, кто начинает разработку проекта в D365 или только задумывается об этом.

Это вольная расшифровка доклада с митапа Mycrosoft Dynamics 365 & Power Platform Meetup.
Читать дальше →
Всего голосов 15: ↑14 и ↓1+13
Комментарии0

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Время на прочтение8 мин
Количество просмотров47K

hero_image


В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.


Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:


  • Снизили размер модели в 2 раза;
  • Научили наши модели делать паузы;
  • Добавили один высококачественный голос (и бесконечное число случайных);
  • Ускорили наши модели где-то примерно в 10 раз (!);
  • Упаковали всех спикеров одного языка в одну модель;
  • Наши модели теперь могут принимать на вход даже целые абзацы текста;
  • Добавили функции контроля скорости и высоты речи через SSML;
  • Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
  • Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).


Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →
Всего голосов 158: ↑157 и ↓1+156
Комментарии100

Собираем «Тревожный чемоданчик». Мнение спортивного туриста

Время на прочтение18 мин
Количество просмотров204K
Когда началась война, все произошло так быстро, что я не могла ни понять, что происходит, ни подумать о том, что хотела бы взять с собой, когда мы убегали. (из интервью сирийской беженки)

Мне почему-то не хочется делать вид, что ничего не происходит. Потому что нынешняя военная эскалация напоминает затишье перед бурей, похожие ощущения были в январе 2020, когда «коронавирус же не у нас, он в Китае». В итоге жизнь подтвердила несостоятельность подобного «психологического» трюка. Поэтому, думая про худшее и надеясь на лучшее, я написал недавно эмоциональную заметку про «тревожный чемоданчик». Написана она с учетом моего опыта спортивного туризма (инструктор гор/пеш), поэтому профессиональные военным (выживальщикам?) просьба отнестись с пониманием. Писалось с акцентом на беларускую аудиторию, и вот искренне надеюсь, что (НЕ) пригодится всем. Просьба не политизировать данную статью, а воспринимать as is. Те кто затевает войны — Хабр не читают. Мы все в одной лодке, надеюсь написанное под катом хоть немного поможет этой «лодке» быть на плаву…


Собираем тревожный чемоданчик вместе
Всего голосов 277: ↑250 и ↓27+223
Комментарии391

Код доступа Termux

Время на прочтение62 мин
Количество просмотров143K

Лонгрид посвящается любителям CLI в знак солидарности лучшего эмулятора терминала на OS Android, который испытывает «кошмарную» монополию Google.

В данной работе вербализация пойдет о нижеизложенном со всеми остановками:

[+] глубоко настраивать средý (флэшка, виджет, стиль, зеркала и конфиги);
[+] управлять серверами через ssh;
[+] скачивать ролики/отрывки с YouTube;
[+] нарезать видео, создавать gif;
[+] воспроизводить текст/музыку/радио прямо в CLI;
[+] нарезать mp3-бигфайлы (аналогов приложений на Android попросту нет), и склеивать аудиофайлы;
[+] редактировать документы;
[+] проверять орфографию: как текстовых файлов, так и различных статей по url, например, проверка орфографии статей на Habr-e;
[+] генерировать словари различной сложности со скоростью Си;
[+] создавать блок-схемы; графики; облако слов и даже 3D-визуализацию;
[+] заниматься Data Science на Android-мощностях;
[+] тестировать интернет соединение/интерфейс (требуется частично Root);
[+] сниффить/сканировать сети (требуется частично Root);
[+] запускать и управлять TOR-сетью (deleted);
[+] управлять приложениями и процессами в ОС Android (требуется Root);
[+] анализировать память;
[+] защищать любые данные от случайного редактирования/уничтожения (требуется Root);
[+] автоматически шифровать и бэкапить по ночам любые данные в своё облако;
[+] чекать username(s) и e-mail(s);
[+] проводить аудит безопасности (об опасности сердить скрипт-кидди с их любимыми: «сниффить, парсить, брутить, дампить, сканить, фишить»);
[+] работать с электропочтой;
[+] изучать UNIX/shell;
[+] программировать на Android (на выбор пользователя. В Termux портированы несколько интерпретируемых и компилируемых языков программирования);
[+] запускать python/php/npm скрипты в т.ч. в одно касание с рабочего стола;
[+] работать с криптографией, стеганографией и цифровыми подписями;
[+] парсить данные;
[*] и даже запускать GNU-GUI-софт из CLI.

Погрузиться в GNU культуру
Всего голосов 30: ↑29 и ↓1+28
Комментарии46

Настраиваем домашний почтовый сервер и уходим с «бесплатной» почты

Время на прочтение15 мин
Количество просмотров309K

С каждым годом рекламы в интернете становится все больше, а подают ее с каждым разом все навязчивее. Дошло уже до почты: реклама в интерфейсе почтового ящика выглядит как первое непрочитанное письмо, которое машинально хочется открыть. Я не против рекламы, особенно когда она в тему и не сбивает с толку. Но маскировать её под непрочитанное письмо ‒ это перебор. Чувствуется, что следующим шагом рекламу начнут вставлять прямо в тело письма.

Читать далее
Всего голосов 108: ↑100 и ↓8+92
Комментарии338

Наши сервисы для бесплатного распознавания речи стали лучше и удобнее

Время на прочтение3 мин
Количество просмотров10K

image


Сейчас для всех желающих доступны два наших сервиса для распознавания речи:


  • Бот в телеграме для коротких и не очень длинных аудио (мы не стали обходить ограничения телеграма, основная задача бота — распознавать голосовые сообщения);
  • Сервис audio-v-text.silero.ai для более длинных аудио, в котором можно скачать отчет в виде эксельки.

Сервис написан нашими собственными силами, работает на нашем собственном движке распознавания речи, без проксирования во внешние сервисы и с минимально возможным количеством зависимостей. В случае нарушения связности возможен оперативный перевод хостинга в другие регионы.


Мы провели и продолжаем работу над ошибками и внесли ряд улучшений для пользователей, о которых мы бы хотели рассказать.

Читать дальше →
Всего голосов 28: ↑27 и ↓1+26
Комментарии15

Как снова начать читать книги, а не ленту. Часть 1

Время на прочтение5 мин
Количество просмотров49K

За последние полгода я прочитала около 20 книг и перечитала ещё десяток старых и любимых. Это не то чтобы очень много, но в пять раз больше, чем я прочитала за полгода перед этим.

Зачем вообще читать книги, а не ленту, лонгриды или смотреть сторисы? Сейчас даже довольно сложную информацию можно найти в более простом и развлекательном формате, чем 400 страниц сплошного текста. 

Я поняла, что нравлюсь себе больше, когда воспринимаю информацию в потоке, большими кусками. Чтобы прочитать книгу, надо в течение долгого времени держать внимание на одной задаче. Мышца внимания тренируется. 

Но если оставить меня в покое, то рано или поздно я обнаруживаю себя, читающей статьи типа «10 полезных статей для дизайнера», «15 случаев, когда логика малышей поставила родителей в тупик», «Хозяева, над которыми подшутили их питомцы, но они не сердятся». Это — режим золотой рыбки. Прочитать и забыть за пять секунд.

Завидую вам, если у вас не так. Эта статья для таких людей, как я — со слабой волей и низменными желаниями. 

Читать далее
Всего голосов 74: ↑67 и ↓7+60
Комментарии92

Круглосуточная трансляции своих видео на YouTube

Время на прочтение11 мин
Количество просмотров77K
Последнее время в качестве хобби снимаю на видео лекции знакомого психолога. Отснятый материал монтирую и публикую на своём сайте. Месяц назад я загорелся идеей организовать круглосуточную трансляцию этих лекций на YouTube в режиме 24/7. Этакий тематический «телеканал», посвященный личностному росту.

Как сделать обычную трансляцию я знаю. А вот как сделать так, чтобы это была трансляция именно видео-файлов? Чтобы она шла 24/7, была гибкой, максимально автономной и при этом никак не зависела от моего домашнего компьютера. Это мне и предстояло выяснить.



На поиск решения ушло несколько дней. Я изучил множество форумов и различных мануалов без которых моя трансляция просто бы не получилась. И теперь, когда шалость удалась, я чувствую потребность поделиться своим решением. Так появилась эта статья.

Если коротко, то итоговое решение получилось следующим: VPS + ffmeg + bash-скрипт. Под катом я описываю проделанные шаги и рассказываю про «подводные камни», которые обнаружились при организации трансляции.
Читать дальше →
Всего голосов 35: ↑33 и ↓2+31
Комментарии20

[В закладки] Базовая карта законодательства РФ по защите информации и как ей пользоваться

Время на прочтение5 мин
Количество просмотров18K

Мы подготовили путеводитель по законам и подзаконным актам в области ИБ, схему для базовой навигации и поиска решений распространенных проблем. 

Она сбережет время и поможет найти документы, в которых прописаны те или иные требования по защите информации, инструкции по работе с различными видами данных, состав проектной документации и так далее.

Читать далее
Всего голосов 29: ↑25 и ↓4+21
Комментарии13

Как улучшить ключевые метрики банка за счет кассовых чеков ОФД?

Время на прочтение8 мин
Количество просмотров4.1K

Плох тот дата сайентист, который не представляет, как будут использоваться его модели в конечных продуктах, как они помогут бизнесу увеличить чистую прибыль, улучшить клиентский опыт или любой другой ключевой показатель в компании. Часто задачи приходят от продуктовых подразделений, но в случае, когда главным компонентом продукта является модель машинного обучения, без экспертного взгляда специалиста не обойтись. В этой статье рассмотрим, как можно принести пользу компании за счет данных кассовых чеков ОФД.

Читать далее
Всего голосов 11: ↑8 и ↓3+5
Комментарии7

Пять альтернатив Scale AI

Время на прочтение6 мин
Количество просмотров2.2K
Выбор подходящего инструмента для аннотирования данных — непростая задача, поэтому чтобы принять верное решение, необходимо знать все возможные варианты. В этой статье мы расскажем о лучших, по нашему мнению, альтернативах Scale AI.


Проекты машинного обучения и глубокого обучения стали сегодня мейнстримом.

Однако несмотря на огромные трудозатраты, только некоторым компаниям удалось превратить свои модели в продукты.

Согласно данным Gartner, для более чем 85% ИИ-проектов есть риск обеспечения плохих результатов из-за погрешностей в данных, алгоритмах или заблуждений разработчиков.

В частности, слабым звеном в ML/DL является качество данных, поскольку успех проектов сильно зависит от объёмов высококачественных размеченных данных, которые способна регулярно создавать команда.

Scale AI одним из первых воспользовался возможностью совершенствования и автоматизации управления, аннотирования и интегрирования данных.

Но Scale — не единственный мощный инструмент в области разметки данных для обучения ИИ.
Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Завышенный уровень делегирования, или «Если бы мне так объяснили, я бы все понял»

Время на прочтение9 мин
Количество просмотров16K
image

"...5 лет назад я работал в почтовом сервисе. В мои обязанности входило сопровождение разнообразных проектов по международным перевозкам. Как-то раз мой начальник пришел ко мне и поручил следующее задание: «Саша, нужно до конца месяца решить проблему с недостатком машин по маршруту Кишинев».

О проблеме я прекрасно знал, так как регулярно сам на это жаловался. Но, одно дело жаловаться, второе решать. Я не знал, как его выполнять…. Но, отказываться от задания я не планировал, и решил хоть попробовать что-то сделать. Для начала, думаю, соберу аналитические данные о предполагаемой нагрузке и количестве необходимых автомобилей, и покажу расчеты начальнику. Я начал собирать информацию о прошлых периодах, о грузах, о динамике и планируемой нагрузке на ближайший квартал. Параллельно выполнял и другие проекты, поэтому сбор аналитики занял около недели.

Когда вся информация была собрана, я пришел к начальнику и начал показывать ему мои расчеты и таблицы. Он прослушал меня минуты 2 максимум, а потом резко остановил и достаточно нервно сказал: «Саша, что ты мне принес?! Я тебя попросил вопрос с машинами решить, а ты мне математику показываешь. Прошла неделя, а ты ничего не сделал! Что тебе не понятно? Пойди к фин. директору и скажи, чтоб согласовал покупку еще двух машин класса А».



Умение поручать задания сотрудникам — это наука всех времен. Сколько книг написано, сколько анекдотов сочинено, а тема всегда популярна. Но в этих всех книгах и анекдотах проблема описывается исключительно со стороны потерь для бизнеса, а о сотруднике и его чувствах говорится мало. Поэтому, я немного дополню проблему именно со стороны демотивации.
Читать дальше →
Всего голосов 28: ↑25 и ↓3+22
Комментарии23

Пишем первого робота для банка

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров8.3K

После прочтения статьи вы сможете написать своего собственного робота и увидеть изумленные глаза домочадцев, наблюдающих, как компьютер сам открывает программы, сам вбивает в них текст и переключает окна. Программист роботизации — это одна из наиболее высокооплачиваемых профессий и хороший старт карьеры для тех, кто хочет изучить Python на примере небольших, но практически ценных задач. В некоторых сценариях это хобби может принести экономическую пользу организации — об этом также написано в статье.

Любопытно, к чему все это приведет
Всего голосов 10: ↑10 и ↓0+10
Комментарии9

Семантика и технология Word2Vec

Время на прочтение6 мин
Количество просмотров7.1K

Сегодня поговорим о NLP-методах векторизации слов - Word Embeddings. Векторы слов лежат в основе многих систем обработки естественного языка и повсеместно используются в современном мире. Рассмотрим работу Word Embeddings на примере нейронной сети Word2Vec.

В более общем смысле Word2Vec удобен для работы с категориальными признаками.

Когда мы говорим о смыслах или о лингвистике, мы имеем дело с сотнями тысяч слов-смыслов. И вот, собственно, Word2Vec и есть та самая современная технология, которая позволяет работать с такими категориальными признаками.

Для демонстрации возможностей технологии Word2Vec введем некую обучающую последовательность данных. Эта последовательность будет в виде расстояния на иерархии isa.

Читать далее
Рейтинг0
Комментарии7
1

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность