Как стать автором
Обновить
0
Артём Тимонин @elioneerread⁠-⁠only

Пользователь

Отправить сообщение

Как быстро выбирать языковые модели (LLM) под свои задачи

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров15K

Последние полгода я активно занимаюсь разработкой сервисов на базе больших языковых моделей, они же «LLM». Для каждого проекта мне приходится подбирать модель по определенным критериям: языковая поддержка, требования к памяти, типу (instruction-based или completion), скорости генерации и т.п. Первое время я использовал платформу HuggingFace, где ежедневно публикуются около сотни новых моделей. Но кто им пользовался, знает, насколько там неудобный и слабый поиск: даже точные совпадения по названию он иногда не выдаёт. Плюс к этому, приходится тратить достаточно времени, чтобы найти и сравнить модели по нескольким критериям. В этой статье я расскажу, как решил проблему выбора языковых моделей.

Читать далее
Всего голосов 27: ↑25 и ↓2+27
Комментарии25

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

Уровень сложностиСредний
Время на прочтение27 мин
Количество просмотров46K

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.

Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.

Читать далее
Всего голосов 25: ↑25 и ↓0+25
Комментарии6

Как стать самостоятельным регистратором .RU/.РФ

Время на прочтение7 мин
Количество просмотров24K
В этой серии статей мы расскажем, как получали аккредитацию, как вы можете получить ее сами и поделимся с вами нашими разработками. Мы в Бегете хотим, чтобы развивались не только мы, но и вся отрасль в целом, так как конкуренция создает хорошие продукты.

В первой статье будет рассказано об административных процедурах, которые необходимо будет выполнить для получения статуса аккредитованного регистратора. Во второй статье мы расскажем и поделимся нашими разработками для интеграции с КЦ (Координационным центром).



Читать дальше →
Всего голосов 30: ↑28 и ↓2+26
Комментарии28

Как разместить статический сайт с помощью Yandex.Cloud Object Storage

Время на прочтение4 мин
Количество просмотров21K
Привет, Хабр!

В этой статье, я расскажу как легко и просто разместить статический сайт с помощью технологий Яндекса, а именно Object Storage.


В конце у вас будет размещенный в сети сайт, который будет доступен по внешней ссылке.


Эта статья будет полезна, если вы


  • Начинающий разработчик, который только обучается программированию;
  • Разработчик, который сделал портфолио и хочет разместить его в открытом доступе, чтобы показать друзьям и работодателям.
Читать дальше →
Всего голосов 7: ↑7 и ↓0+7
Комментарии10

DALL-E 2 vs MidJourney: наш опыт практического применения нейросети для оформления сайта…и не только

Время на прочтение6 мин
Количество просмотров44K

Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили. 

Читать далее
Всего голосов 41: ↑38 и ↓3+39
Комментарии37

Большой гайд по UTM-меткам: как узнать, откуда приходят пользователи

Время на прочтение20 мин
Количество просмотров260K
Большой гайд по UTM-меткам: как узнать, откуда приходят пользователи

Способы разметки ссылок придуманы давно. Но как обычно, разные стандарты смешались и выбрать правильный формат не так просто. Оставим в стороне случаи, когда владелец площадки возражает против размеченных ссылок (а это не такой уж редкий случай). Разберемся в деталях — какие и когда UTM-метки ставить и что с ними делать дальше.

Читать дальше
Всего голосов 5: ↑3 и ↓2+3
Комментарии2

Сага о SEO, часть 1: серверный рендеринг

Время на прочтение18 мин
Количество просмотров8.7K

Наверняка хотя бы раз в жизни вы или ваши знакомые в поисках приятного досуга на вечер обращались к Яндексу или Гуглу с запросами вроде “кино онлайн бесплатно” или “смотреть сериалы 2021”. Если так, не стоит стесняться, вы такой не один, с подобными запросами в Яндекс, например, обращаются несколько миллионов человек в месяц. При этом, скорее всего, как и большинство пользователей с таким запросом, вы не имеете преференций относительно того, где вам этот контент покажут, и перебираете ссылки в выдаче сверху вниз, пока не найдете устраивающий вас ресурс. А значит, владельцы этих ресурсов максимально заинтересованы в том, чтобы

Читать далее
Всего голосов 9: ↑8 и ↓1+11
Комментарии6

Я год шпионил за собой — что из этого вышло. Простой секрет личной эффективности

Время на прочтение5 мин
Количество просмотров122K

На стенах храма Аполлона было написано "Познай самого себя", но там нигде не было сказано как это сделать. Предлагаю исправить такое положение дел, да и к тому же разобраться как это поможет стать более продуктивным.

Читать далее
Всего голосов 76: ↑69 и ↓7+83
Комментарии145

Всё про налоги для IT-фрилансеров. ИП и самозанятые. Часть 1

Время на прочтение6 мин
Количество просмотров62K


Раньше у IT-фрилансеров было только два варианта работать легально: зарегистрировать ИП на УСН или на патенте. С этого года появилась ещё одна альтернатива — стать самозанятым. Пока новый режим действует только в 4 регионах, но в 2020 году его планируют ввести на всей территории РФ.


Когда регистрировать ИП? Кто такие самозанятые? Какой режим выгоднее для фрилансера? Что выбрать c доходом 100, 200 или 300 тыс. руб. в месяц? Мы подробно ответим на эти и другие вопросы.


Статья состоит из трёх частей. В первой части мы расскажем про ИП и самозанятых. Во второй — сравним УСН, патент и налог для самозанятых. В третьей — рассчитаем налоговую нагрузку для ИП на разных режимах.


Добавляйте в закладки, чтобы почитать на выходных. И добро пожаловать под кат.

Читать дальше →
Всего голосов 18: ↑18 и ↓0+18
Комментарии20

4,2 гигабайта, или как нарисовать что угодно

Время на прочтение9 мин
Количество просмотров42K
В нашем мире мы можем сделать всё, что захотим. Всё что угодно.

Боб Росс, The Joy Of Painting, сезон 29, эпизод 1

Однажды, когда я наблюдал за ярким закатом в Сиэтле, внезапно включилось моё воображение. Потусторонний оттенок неба пробудил воспоминания о чём-то из научной фантастики. Дымчатый оранжево-сиреневый завораживал.

Я представил огромный инопланетный объект, висящий в горящем оранжевом небе над давно покинутым Сиэтлом, здания которого покрыты зарослями.

Тем же вечером я за несколько часов создал вот такое изображение:


Простите за низкое разрешение — к сожалению, у моего GPU всего 12 ГБ памяти.

Поскольку очевидно, что я талантливый художник, имеющий за плечами буквально десятки минут опыта, мне захотелось поделиться тем, как я создал данный шедевр.
Читать дальше →
Всего голосов 160: ↑160 и ↓0+160
Комментарии92

О самодельном тепловизоре

Время на прочтение8 мин
Количество просмотров38K

Периодически для разных целей возникает потребность в измерении диапазона температур. Достичь этой цели можно разными средствами, но лучше всего для этого подходит тепловизор. Одна проблема, — подобное устройство не отличается низкой ценой. А реально ли его построить самому? Об этом мы и поговорим в этой статье.

Читать дальше →
Всего голосов 56: ↑51 и ↓5+70
Комментарии48

Как вытянуть данные через официальный API ВК

Время на прочтение12 мин
Количество просмотров30K

API ВКонтакте используют не только для сбора статистики, но и для отложенного постинга, отправки сообщений. Мы с командой активно применяем его для автоматизации отчетности по SMM и таргету. Поэтому поговорим про сценарии использования, когда нужно получить статистику из ВКонтакте для обработки в других системах. Кратко расскажем, как в целом работает API, поделимся методами, которыми пользуемся сами. В конце пройдемся по сложностям, от которых зависит результат.

Читать далее
Рейтинг0
Комментарии1

DIY. Книги для всех, даром

Время на прочтение7 мин
Количество просмотров35K

Lingtrain cover


⚡ Градиент обреченный


Upd. 11.06.2022 Многие заинтересовались генерацией изображений нейросетями. Вот Colab (интерактивная среда для запуска кода) для рисования картинок в стиле pixel art по текстовому описанию. Просто запускайте, ближе к концу увидете ячейку для ввода текста. Примеры картинок из Colab'а в комментариях.


Два года назад я начал делать небольшой проект, связанный с обработкой текстов на иностранных языках. Он постепенно развивался и стал использоваться лингвистами в НКРЯ, а энтузиасты сохранения малых языков используют его для расширения своих параллельных корпусов.


Сегодня же я расскажу как при помощи него создать полноценную параллельную книгу на разных языках. Книга будет красиво сверстана в PDF, иметь содержание, обложку и две выровненные по смыслу колонки текста. Такие книги служат отличным подспорьем при изучении иностранного языка. Найти их, однако, не так просто, и скорее всего это будут книги для детей или избранная классика. Полный пример готовой книги можно посмотреть здесь. Под капотом у приложения NLP модели, поддерживаемых языков более ста.


Проект открытый и любой может в нем поучаствовать. Во многом благодаря сообществу и вашему участию он за несколько лет дошел до сегодняшнего дня. В общем штука годная, давайте уже посмотрим, что к чему.

Сделать книжку
Всего голосов 76: ↑76 и ↓0+76
Комментарии50

Kickstarter запретил ГМО

Время на прочтение1 мин
Количество просмотров120K
В минувшую среду известный краудфандинговый сайт Kickstarter внёс изменения в правила своей работы. К числу запрещённых проектов на сайте добавлены проекты с ГМО (генетически модифицированными организмами). Это произошло всего через пару недель после того, как компания Glowing Plants собрала $484 тыс. на разработку светящихся растений.


Читать дальше →
Всего голосов 120: ↑110 и ↓10+100
Комментарии194

Google Play — работаем легально!

Время на прочтение4 мин
Количество просмотров179K
Привет, Хабр!



Сегодня, я хочу рассказать о том как сделать свое хобби по разработке Android-приложений пусть небольшим, но официальным бизнесом. О том, как легально получать деньги, заработанные на Google Play, о «страшном» валютном контроле и «таинственном» паспорте сделки.
Читать дальше →
Всего голосов 92: ↑88 и ↓4+84
Комментарии115

Потеряет ли MySpace когда-нибудь свою монополию?

Время на прочтение3 мин
Количество просмотров26K
Эта статья была опубликована 6 лет 3 месяца 19 дней назад, 8 февраля 2007 года. На тот момент «Фейсбук» едва приближался к двум десяткам миллионов зарегистрированных пользователей, и известное всем развитие событий позволяет по-новому взглянуть на прогнозы будущего творения Марка Цукерберга, которое по ряду оценок уже сейчас постепенно теряет популярность среди некоторых групп пользователей.

Аристотель различал дружбу на основе совместных интересов и связующего единомышленников чувства взаимной близости. Бо́льшая часть зарегистрированных пользователей «МайСпейса», феноменально успешного сервиса социальных сетей Руперта Мёрдока, попадает в последнюю категорию. Но очевидность продолжающегося расширения, которое с взрослением поколения «МайСпейса» может постепенно увеличить влияние Мёрдока, заставляет поблекнуть контроль Руперта над спутниковым телевидением.

В момент покупки высказывались предположения, что если Мёрдок попытается испортить коммерциализацией майспейсовскую «культуру обмена контентом», пользователи просто уйдут на один из десятка наплодившихся клонов — от Bebo.com до восходящей мобильной звезды Cyworld.com, которая уже завоевала Южную Корею и сейчас ведёт бои на отшибе «МайСпейса» в США. «Сайуорлд» указывает на исследования, согласно которым «МайСпейс» — сайт переходного возраста, из которого детки всё-таки вырастут, в то время как «Сайуорлд» — это полноценный сайт социальных сетей. Получается интересное, почти по Аристотелю разграничение, но некоторые считают, что сместить «МайСпейс» конкурентам под силу лишь с нишевых рынков.

Джон Барретт (TechNewsWorld) утверждает, что «МайСпейс» уже уверенно встал на рельсы становления тем, что экономисты называют «естественной монополией». Пользователи вложили настолько много социального капитала в метод публикации информации о себе, что менять сайты будет невыгодно, особенно, с учётом ценности, добавляемой к «МайСпейсу» с каждым новым привлекаемым пользователем.
Читать дальше →
Всего голосов 28: ↑20 и ↓8+12
Комментарии10

Быстрое возведение чисел от 1 до 100 в квадрат

Время на прочтение3 мин
Количество просмотров140K
Вдохновленный этой статьей, решил поделиться с вами способом быстрого возведения в квадрат. Возведение в квадрат более редкая операция, нежели умножение чисел, но под нее существуют довольно интересные правила.


*квадраты до сотни

Для того, чтобы бездумно не возводить в квадрат по формуле все числа, нужно максимально упростить себе задачу следующими правилами.
Читать дальше →
Всего голосов 118: ↑83 и ↓35+48
Комментарии38

Китайский интернет-магазин изнутри

Время на прочтение3 мин
Количество просмотров27K
Мы находимся в номере гостиницы в городе Шеньчжень (позор мне, за два дня я так и не научился его правильно произносить — постоянно путаю первую и последнюю части, получается чжешьшень. И пишу так же).
Уже вечер, и необходимо ложиться спать — завтра надо встать в 7 часов, и к 8 уже быть в офисе — начнется рабочий день.
От нашей гостиницы ехать примерно 40 минут на автобусе. На метро было бы быстрее, но дольше добираться от ближайшей станции.

Ждем автобуса:

Читать дальше →
Всего голосов 138: ↑130 и ↓8+122
Комментарии122

Видео-квесты на YouTube — новый тренд?

Время на прочтение1 мин
Количество просмотров27K
Считается, что первым интерактивным видео-квестом стала серия роликов «Брось оружие!» (Drop The Weapons), запушённая лондонской полиции в 2009 году. В этом социальном квесте каждый посетитель YouTube может сам выстроить логическую цепочку событий и либо попасть в тюрьму, либо на вечеринку. За 2 года все ролики этого канала просмотрели более 3,5 миллионов раз.
Читать дальше →
Всего голосов 36: ↑32 и ↓4+28
Комментарии19

Электронная подпись на УЭК, что даёт и нужна ли вообще? Часть 4

Время на прочтение6 мин
Количество просмотров138K
Это 4-ый пост, который посвящён описанию возможностей УЭК. Предыдущие части:
1) Опыт получения универсальной электронной карты. Розовая теория против суровой реальности. Часть 1
2) Как я получил универсальную электронную карту после 3-х месяцев ожидания. Часть 2
3) Практическое применение универсальной электронной карты (УЭК) в городе и интернете. Часть 3



Поначалу, я хотел лишь оформить отдельным комментарием к своему топику то, как я наконец-то записал электронную подпись (ЭП) на Универсальную электронную карту (УЭК). Однако информации для одного комментария слишком много, а до отдельного топика она ещё была скудноватой. И вот теперь, спустя чуть ли не месяц после того, как я достал Сбербанк, и записал ЭП на УЭК, я могу с полной уверенностью говорить, что УЭК с ЭП действительно чего-то, да стоит. Без ЭП — кусок красивого и пока редкого пластика, хоть и более крутого, чем тот, который используется для изготовления обычных карт. Но обо всём по порядку.
Читать дальше →
Всего голосов 33: ↑29 и ↓4+25
Комментарии68
1
23 ...

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность