Обновить
5
80.8
Mawo@Mawo

Пользователь

Отправить сообщение

Меня позвали в крутой проект, спасибо, Хабр

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели13K

Но я облажался...

Блин я даже в школе столько правил по русскому не читал, какой же наш язык сложный, а что бы реализовать все проверки, что бы правила корректно отрабатывали, проще застрелиться... Пришлось гуглить информацию по ЕГЭ 2025 года и ковыряться на НКРЯ. Много нового узнал =)

В общей сложности потратили неделю, на реализацию концепта, функционал, перенос правил русского языка.

Читать далее

Как мы адаптировали LLM для русского языка

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели7.2K

Как мы потратили 2 месяца на адаптацию Qwen3-0.6B для русского языка. Написали систему с нуля на основе 8 научных статей из arXiv. Исправили 6 критических багов (от NaN в fp16 до архитектурных проблем). Получили +35% training speed и +60% inference speed. В этой статье - честный рассказ о том, что не работает из коробки, какие грабли ждут в production, и как мы их обошли.

Мы - это я и мой друг =)

Читать далее

Вайбкодинг: почему знания важнее инструментов

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели15K

Вайб-кодинг стал словом 2025 года по версии Collins Dictionary. 80% российских разработчиков уже попробовали этот подход, а четверть стартапов в Y Combinator имеют кодовую базу, на 95% сгенерированную ИИ. Но за красивыми цифрами скрывается неудобная правда: Вайб-кодинг — это не волшебная палочка для тех, кто не умеет программировать, а мощный инструмент, эффективность которого напрямую зависит от знаний пользователя.

Что такое Вайб-кодинг и почему о нём все говорят

В феврале 2025 года Андрей Карпатый, бывший директор по ИИ в Tesla и сооснователь OpenAI, опубликовал твит, который изменил индустрию:

"Существует новый способ писать код, который я называю «вайб-программированием», когда вы полностью погружаетесь в поток и забываете, что код вообще существует. Я прошу сделать самые примитивные вещи вроде «уменьши размер боковой панели в два раза», потому что мне лень искать это место в коде."

Суть проста: описываешь задачу словами — ИИ пишет код. "Программирование атмосферой, а не переменными", как написал Collins Dictionary. Низкий порог входа и скорость создания MVP сделали подход популярным. Cursor, Windsurf (который OpenAI купила за $3 млрд), Claude Code, GitHub Copilot — инструменты доступны каждому.

Но давайте посмотрим, что происходит, когда этими инструментами пользуются люди с разным уровнем подготовки.

Читать далее

Собрали 47 живых русских open-source проектов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K

Откройте package-lock.json любого проекта. Ctrl+F "postcss". Нашли? А теперь "autoprefixer", "browserslist", "nanoid". Всё есть? Поздравляю — вы используете экосистему одного человека, Андрея Ситника.

Redux? Дэн Абрамов, Санкт-Петербург. ClickHouse? Яндекс, обрабатывает триллионы записей в Uber. core-js? В 60% всех npm пакетов. Fira Code? Самый популярный моноширинный шрифт для программистов.

Мы используем русский open-source везде, но не знаем об этом.

Решили это исправить. Собрали кураторский список живых русских проектов с жёсткими критериями отбора. Вот что получилось.

Читать далее

Как мы воскресили русский NLP и сократили потребление памяти на 90%

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели15K

Как мы воскресили русский NLP и сократили потребление памяти на 90%

Форкнули четыре ключевых библиотеки русского NLP (pymorphy, razdel, slovnet, natasha), которые не обновлялись годами. Сократили потребление памяти на 90%, ускорили загрузку в 30 раз, повысили точность токенизации с 70% до 95%. Всё работает offline, 100% совместимо с оригинальными API. Экосистема MAWO — production-ready инструменты для работы с русским текстом.

Помните ли вы тот момент, когда открываешь проект для обработки русского текста и видишь знакомую картину? В requirements.txt красуется pymorphy2, последний коммит в репозитории датирован 2015 годом, Python 3.12 ругается на deprecated методы, а production ждать не будет. Знакомо? Тогда эта история для вас.

Читать далее

Информация

В рейтинге
87-й
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, Фронтенд разработчик