Pull to refresh
26
0
Cry_san @cry_san

User

Send message

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

Level of difficultyEasy
Reading time11 min
Views14K

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex.

Читать далее

Солнце «в кармане»: солнечный концентратор

Reading time8 min
Views15K

Со времён древнейших "лучей смерти" Архимеда, человечество обращало своё внимание на солнце - как важнейший источник лучистой энергии. 

С тех лет прошло много времени, и люди нашли другие способы передачи энергии, с помощью оптического излучения – например, с применением лазеров. 

Однако это их не заставило отвернуться от Солнца, и инженеры придумывают всё новые и новые варианты использования его живительного света. 

Один из которых, впрочем, ничем не отличается от легендарного метода Архимеда - сбор солнечного света с помощью зеркал: с помощью солнечных концентраторов.

Читать далее

Как я горел от 3D-печати

Level of difficultyEasy
Reading time6 min
Views28K

Привет! Меня зовут Антон Рогозин и я разработчик машинного обучения в Контуре. В этой статье расскажу про своё увлечение 3D-печатью, а точнее о том, как я подгорел от того, сколько нюансов надо учесть, чтобы распечатать под ключ маленькую фигурку хорошего качества. 🤌 Хотите узнать, как выглядит процесс изготовления 3D-моделей, какой принтер купить и сколько стоит инвентарь для печати? Тогда приглашаю под кат. Ещё внутри этой статьи затаилось много полезных ссылок, которыми я советую пользоваться, и, конечно же, фото моих фигурок из настольной ролевой игры D&D (подземелья и драконы).🧌 Заходите оценить.

Читать далее

Все жалуются на сезонность, а я просто меняю вывеску и делаю 20 млн в год

Level of difficultyEasy
Reading time8 min
Views122K

У меня есть два бизнеса в одном помещении. Летом — велосервис, зимой — прокат горнолыжного снаряжения. Оборот 20 миллионов в год, рентабельность 28%. Между сезонами я полностью переделываю торговый зал, переставляю оборудование и меняю специализацию. Это единственный способ выжить на рынке, который кардинально поменялся за последние пять лет.

Читать далее

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

Level of difficultyMedium
Reading time5 min
Views6.9K

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.

Читать далее

ЧикиПуки — генератор развивающих заданий для детей

Level of difficultyEasy
Reading time4 min
Views1.4K

Привет, Хабр!

Не так давно прозвенел очередной первый звонок и я решил рассказать о своём небольшом образовательном pet-проекте, который начинался как пара скриптов для домашних занятий, а по итогу стал помощником для многих родителей и педагогов, занимающихся развитием малышей.

Меня зовут Коновалов Павел, я фулстек разработчик. В свободное время работаю над проектом ChikiPooki.com. Это образовательная онлайн-платформа для родителей детей дошкольного и младшего школьного возраста, где можно создавать и распечатывать развивающие задания, учитывая возраст и уровень знаний ребёнка.

Читать далее

Zip-бомбы против агрессивных ИИ-краулеров

Reading time4 min
Views32K

Некоторые владельцы сайтов жалуются на большое количество ботов, которые создают нагрузку на серверы, особенно краулеры для LLM (ИИ). По информации аналитического отчёта Fastly, краулеры, скраперы и фетчеры иногда создают нагрузку на сайт до 39 тыс. запросов в минуту.

В 2025 году нагрузка от скраперов выросла на 87%, причём основной трафик идёт от RAG-скраперов, а не для первичного обучения моделей.

Читать далее

Я сварил палки, выложил на Авито и заработал 10 млн за год

Level of difficultyEasy
Reading time10 min
Views208K

Сфотографировали, выложили объявление на Авито.

В тот же день я поехал в Москву с дочерью. Стою 2 часа в пробке, а мне звонят без остановки. Я отвечаю, объясняю, что мы продаем. Бешеный шквал звонков. 

Дочь послушала все это, спросила:

— Папа, а что это за такой бизнес интересный?)

И я понял — тут есть деньги.

Читать далее

Одна грязная чашка или как мелкий беспорядок разрушает великие компании

Reading time3 min
Views3K

Что общего у падения уровня преступности в Нью-Йорке 90-х, грязной чашки и ваших годовых KPI?

В статье разбираем принцип «Теории разбитых окон», чтобы вовремя увидеть и устранить скрытые угрозы, которые подрывают вашу корпоративную культуру и съедают прибыль.

Читать далее

$220К в месяц на индексации сайтов для Google

Level of difficultyEasy
Reading time6 min
Views27K

Разбираю, как программист создал простой сервис для рендеринга JavaScript в HTML. Продвинул его бесплатным способом. И вывел на доход $220К в месяц.

Читать далее

Как мы перестали контролировать своих сотрудников

Level of difficultyMedium
Reading time4 min
Views33K

Когда мы начали расти в отделе, мне казалось логичным ввести разные системы контроля: отслеживание рабочего стола, трекеры времени, «умные» дашборды. Хотелось прозрачности — чтобы понимать, кто чем занят и как распределяются часы.

Мы пробовали разные инструменты — Time Doctor, Insider и тд. На первый взгляд все выглядело удобно: дашборд продуктивности, графики активности, таблицы задач. Но на деле сотрудники ощущали себя дискомфортно, чувствуя себя под слежкой, ведь так оно и было. Мое мнение теперь: мы ошиблись и потратили время и средства на инструменты, которые не принесли пользы. И вообще для программы отслеживания рабочего времени нужно переименовать в инструменты слежки за сотрудниками. Как будто сериал “Разделение” воплотился в жизнь. Но обо всем по порядку

Читать далее

Древние способы охлаждения

Reading time8 min
Views20K

Современный человек, вспоминая о прежних временах, частенько относится к ним с достаточной долей самодовольства, мол, «чего они там знали и могли уметь, — с ветки на ветку прыгали, вот и всё» :-). 

Однако, изучая историю, мы каждый раз натыкаемся на удивительные примеры того, что в корне развеивает этот озвученный подход, ибо «древние таки кое‑что умели!».

И сегодня мы поговорим о паре таких примеров — как люди, ещё в древности, делали свои собственные холодильники.

Да простые, да «без нанотехнологий» — но, оно работало, и это главное!

Кстати сказать, этот подход не утратил свою актуальность и поныне, так как знать технологические приёмы создания низких температур, без какого‑либо электропитания и современных материалов — это, как минимум, интересно, а как максимум, может вполне и пригодиться в каких‑то неожиданных ситуациях...

Читать далее

Как AI изменил рынок труда и почему у IT-джуниоров мало шансов найти работу

Level of difficultyEasy
Reading time5 min
Views13K

Искусственный интеллект сделал то, чего раньше не знал рынок труда. За короткое время он сократил сотни тысяч стартовых вакансий и оставил лишь узкий коридор для новичков с AI-скиллами. Теперь молодые специалисты могут быстро выйти на высокий доход, тогда как другим становится сложнее найти первый шаг в профессию.

Поговорим о том, как AI изменил рынок для IT-новичков, и почему сегодня карьерные перспективы зависят от умения работать с нейросетями.

Читать далее

Как заранее проверить название проекта, чтобы потом не тратить деньги и время на суды

Level of difficultyEasy
Reading time4 min
Views974

«Как вы яхту назовете, так она и поплывет» уже не актуально. Актуально — придумать для проекта такое название, чтобы потом оно стало брендом, товарным знаком, узнаваемым доменным именем.

Ключевой момент — оно должно быть уникальным, иначе потом, когда вы вложите в проект много сил времени и денег, то будет очень обидно получить претензию от конкурента о том, что вообще‑то вы используете его товарный знак, и теперь должны заплатить ему круглую сумму (с января 2026 — до 10 миллионов, а то их х2 выручки от реализованной продукции или оказанных услуг), а потом еще провести ребрендинг и потратиться на замену этикеток, высок, указателей, униформу для сотрудников, смену названия сайта и всего остального.

Как вам перспектива? И вроде бы всем все ясно, но некоторые ленятся даже погуглить, нет ли чего‑то похожего, не говоря уже о том, чтобы посмотреть в специальных сервисах.

Я как юрист люблю заниматься сложными задачами, и поэтому хочу рассказать о простых — поделиться, как проверить заранее название для нового проекта:

Как этого избежать? Проверить все заранее.

Есть несколько простых шагов. Рассказываю.

Читать далее

Учим ai-агента ориентироваться на местности: кастомный tool на python и overpass (OSM)

Level of difficultyMedium
Reading time5 min
Views1.6K

Привет, Хабр!

Современные AI-агенты уже умеют планировать отпуск, писать код, и совершать покупки в интернете, но поставьте их перед простым вопросом «где лучше снять квартиру рядом с метро и школой» - и они начинают галлюцинировать. Они не понимают, что «5 минут до метро» и «500 метров по прямой через реку» - совершенно разные вещи. В результате пользователь получает красивые, но бесполезные советы

Этот проект покажет, как добавить агенту «глаза» для карты, чтобы он мог реально находить ближайшие кафе около парков, считать расстояние пеших прогулок и показывать результаты прямо на интерактивной карте

Читать далее

Polars — «убийца Pandas» на максималках

Level of difficultyEasy
Reading time35 min
Views4.9K

Всем привет! Меня зовут Александр Андреев, я инженер данных. Сегодня я хочу рассказать вам о библиотеке Polars - потенциальной замене Pandas, любимой у большинства дата-инженеров и дата-саентистов библиотеки для работы с данными.

В своей статье я последовательно пройдусь от истории библиотеки Polars до примеров кода, технических аспектов ее производительности и в конце дам ссылки на все бенчмарки, обучающие материалы и дополнительные статьи, которые использовались для написания данного обзора-туториала по этой замечательной библиотеке.

Читать далее

Pixel Table: от идеи до реализации интерактивного пиксельного стола

Level of difficultyMedium
Reading time9 min
Views5.1K

Меня зовут Анатолий, и я программист с инженерным бэкграундом. Помимо основной деятельности, бэкенд разработки на Go, меня часто тянет собрать что-нибудь эдакое электронно-светодиодное с использованием микроконтроллеров.

Этап 0: Как всё начиналось

Однажды мне попался на глаза проект пиксельного стола, и я подумал, что было бы круто сделать стол не просто с красивыми визуальными эффектами, а ещё и с играми и звуковым сопровождением, т.е интерактивный. И я начал изучать тему…

Читать далее

Полезные конструкции Python, которые упростят работу с данными

Level of difficultyEasy
Reading time25 min
Views19K

Даже без сторонних библиотек в языке есть много встроенных инструментов, которые помогают лаконично обрабатывать данные, писать читаемый код и избегать лишних проверок и циклов. 

В этой статье мы собрали конструкции, которые пригодятся как начинающим, так и более опытным разработчикам.

Читать далее

Похороны стартапа на Патриарших: как мы завайбкодили сервис и остались без аудитории

Level of difficultyEasy
Reading time16 min
Views12K

«Человек всегда велик в намерениях. Но не в их выполнении. В этом и состоит его очарование» — что-то на глубоком из Ремарка «Три товарища»

В какой-то момент понимаешь, что новый бизнес должен начинаться не с красивого названия и не с логотипа. С чего именно — до конца не ясно, но точно не с этого. Эта статья — о том, как я попытался перепрыгнуть через все эти «обязательные шаги», завайбкодив их, а заодно и большую часть кода проекта с помощью нейросетей, и сосредоточился только на финальных вещах — тестировании аудитории и маркетинге.

А дальше — история о студенческом стартапе для поиска ивентов, который мы собрали на коленке за лето, запускали через тусовки на Патриарших Прудах, но так и не смогли набрать аудиторию.

Самая интересная часть начинается с главы «Возвращение: новая команда и быстрый релиз», но я искренне рекомендую читать статью с самого начала. Так будет проще уловить весь контекст и понять, почему проект получился именно таким, каким он получился.

Читать далее

Information

Rating
Does not participate
Location
Хабаровский край, Россия
Registered
Activity

Specialization

Software Developer, Game Developer
Middle