Комментарии / Профиль foss22 / Хабр

Пользователь

-0,1

Рейтинг

Полный геном и его анализ в домашних условиях: сам себе генетик с Just-DNA-Lite, плагин для Claude Code. Часть 4

Немного не так. Гипер-фокус как раз характерен для этого синдрома. Дефицит не внимания, а дефицит способности управлять вниманием. По сравнению с теми, кому управлять вниманием легко (большинству легко).

Публичность или небытие: как AI меняет цену знания

foss22 20 июл в 11:30

sed 's/ AI / LLM, на публичных датасетах обученные/g'

LLM, на внутренних закрытых датасетах обученные если добавить, то немного поменяется смысл некоторых утверждений из статьи. Они становятся спорными. Речь не об AI в целом, а только о подмножестве LLM с подмножеством LLM, обученных на публичных датасетах.

Пример спорного утверждения:

LLM модель при обучении не ассимилирует их наработки, не проанализирует их код, не включит в свою “память” — а значит, эффективность применения AI в закрытых проектах будет ощутимо ниже.

Эффективность будет достаточной, если дообучить LLM на данных закрытого проекта.

ICLR 2026 в Рио-де-Жанейро: главные ML-тренды, математика и инсайты

foss22 15 июл в 12:35

очень приятно было понять, что ты не одинок в своей работе. Где-то в мире почти наверняка есть человек, который параллельно с тобой решает похожую задачу, сталкивается с теми же ограничениями и задаёт себе те же вопросы. Конечно, изначально немного наивно думать, что только ты крутишь LLM’ки и никто больше с такими проблемами не сталкивался. Но когда внутри твоей команды люди занимаются другими направлениями, а друзья из других компаний не встречали именно твоих кейсов, такое ощущение действительно может возникнуть.
Конференция в этом смысле работает как быстрый способ найти своих: людей с похожими интересами, задачами и болью

С другой стороны...

Гордое одиночество это хороший признак. Значит ты нащупал уникальную задачу, где тебя не заменить. Даже если задача -неуловимый Джо.

Если в мире есть человек, который параллельно с тобой решает похожую задачу - пусть он и решает. Разделение труда. Приятно еще больше.

Как GPT-5.6 Sol обошла математиков в задаче о длине пути градиентного спуска

foss22 15 июл в 07:26

к этому случаю претензия применяется плохо: человеческий рекорд 2.29 никогда не публиковался, вспоминать его модели было неоткуда.

Но ведь GPT-5-N обучались не только на публикациях. Ещё и на историях диалогов с живыми математиками. Кто (кроме имеющих доступы к логам чатов проприетарной модели) проверял семантическое сходство решения с миллионами диалогов?

выдать забытый чужой результат за свежее открытие — без ссылки на первоисточник.

Годный способ опенсорсить чужие ценные знания. Если отбросить негативные коннотации про “отмывание знаний”

Полный геном за $200 и его анализ в домашних условиях: Just-DNA-Lite, ИИ и пересборка генома. Часть 3

foss22 14 июл в 10:47

В телеграме есть чат Генотека. Посмотреть не могу, поскольку телеграм без ВПНов уже не работает, а я не пользуюсь ВПНами. Если у Вас работает tg, то поиском найти в чате сообщения Александра про "полногеномные" сиквенсы.

Яндекс-поиск показывает контакт, ему можете написать напрямую:

elegram: Contact @alexrakitko t.me›alexrakitko

Alexander Rakitko. @alexrakitko. Genotek CSO. If you have Telegram, you can contact Alexander right away. РКН: иностранный владелец ресурса нарушает закон РФ

Вероятно, и на хабре сработает иконка Отправить сообщение @Genotek

Полный геном за $200 и его анализ в домашних условиях: Just-DNA-Lite, ИИ и пересборка генома. Часть 3

foss22 12 июл в 21:49

В чатике Генотека в телеге их представитель (Александр) предлагал всем, у кого полный геном секвенирован загрузить к ним (примерно сто гигов, в индивидуальном порядке, это пока редкость) для получения их отчётов. Они заинтересованы, поскольку полный геном позволяет точнее искать родню (+ болезни исследовать), чем у кого чиповые тесты, их в Генотеке львиное большинство.То есть выигрывают все от полного сиквенса, не только тот, кого секвенировали, но и его родня (сдавшая только дешевый тест на основе чипа GSA).

habrGPT. Обучим LLM 0.5B с нуля на статьях Хабра с помощью nanochat от Карпатого. Обучение fp8 дома и сравнение с bf16

foss22 10 июл в 10:41

Да, стриминг. Добучать постоянно не на данных, лежащих на диске, а постоянно тянущихся из сети и временно кэшированных, за последнюю неделю например из кэша браузера.

habrGPT. Обучим LLM 0.5B с нуля на статьях Хабра с помощью nanochat от Карпатого. Обучение fp8 дома и сравнение с bf16

foss22 10 июл в 10:36

последовательности 2048 токенов.

Скорее всего появятся сотни клонов, где нашинкован датасет однажды опенсорснутый, который пытаются снова закрыть. Анонимайзером вычистить лэйблы, упоминания хабра, ПД и привязки к авторам и всё ОК ведь будет? Это уже не будет целостное произведение, не статья, не объект авторского права.

habrGPT. Обучим LLM 0.5B с нуля на статьях Хабра с помощью nanochat от Карпатого. Обучение fp8 дома и сравнение с bf16

foss22 10 июл в 09:48

пытался обучить 7B модельку, которую с помощью многих ухищрений удалось вместить в 32Гб, но скорость обучения была 500 t/s.

Расскажите плиз про эти ухищрения. Как искали границу чтобы влезала? Какие оптимизации? Скорость медленная не так важна, главное чтобы влезала. Пусть хоть месяц или полгода учится, на нужных кастомных датасетах.

Полный геном за $200 и его анализ в домашних условиях: Just-DNA-Lite, ИИ и пересборка генома. Часть 3

foss22 10 июл в 05:52

связывают с пониженным риском рака и долголетием ценой невысокого роста. Только этот «вариант невысокого роста» достался человеку заметно выше среднего — мне.

Поскольку клеток в теле высокого больше, чем в теле низкого - вероятность возникнуть и закрепиться раковым клеткам выше у высокого. Логично же? Только как в этом помогает знание геномной последовательности? Проще же определить размер человека на глаз.

T1a1

Пра*бабушку молодую красивую вывезли новгородцы или карелы/ижора (как вариант) в качестве военного трофея?

один из важнейших городов Швеции, политический и религиозный центр в эпоху ранней христианизации, крупнейший торговый центр страны в XI—начале XII вв. В 990-х годах здесь впервые в Швеции были отчеканены серебряные монеты, они носили изображение короля Олафа Шётконунга.
Считается, что 12 августа 1187 года Сигтуна была захвачена новгородцами и союзными им карелами и эстами; также иногда пишут и об участии народа ижора, архиепископ Уппсальский убит, а город опустошён настолько, что уже не оправился. Среди похищенного якобы были бронзовые церковные ворота, которые уже при жизни Эрика украшали церковь в Новгороде

https://руни.рф/Гаплогруппа_T_(мтДНК)
T1, T1a1j, T2 и T2f1 определены у обитателей Сигтуны, живших примерно в X—XII веках

Загрузите мито-сиквенс в файле .bam на yfull - получите чатик - переписка с роднёй по женской и мужской прямым веткам.

на дешёвой CMP 90HX… DeepVariant отработал на ней штатно, вызов вариантов уложился в пару часов

Команду запуска и версию добавите? И сколко ватт выставлено nvidia-smi -pl

бесплатный магазин расширений: модули оформлены в специальном формате, так что любой соберёт свой (руками или с помощью ИИ по научной статье) и выложит для других.

Хочется плагин браузера - читаешь свежую научно-популярную статью, а плагин сразу подсвечивает ответ на вопрос - твои варианты или не твои? Актуальна для тебя статья или нет... Именно по свежим статьям, котрых пока нет в базе Clinvar

>Знать слабое место заранее дешевле, чем ловить проблему по факту.

эх, если бы еще врачи превентивную медицину поддерживали, но обычно только симптомных принимают, обычно как в милиции "приходите когда убьют" )

Генотек кстати принимает полногеномные bam - загрузите - получите отчёт в том числе полигенные риски с красивыми графиками вклада каждого варианта. Плюс родственников несколько тысяч найдётся.

В AIRI создали нейросеть Genatator для разметки генов по последовательности ДНК и аннотации геномов без подробных данных

foss22 4 июл в 16:18

человека и 38 видов млек

Интересно как изменятся предсказания модели, если добавить ещё 1 или 2 вида в обучающие данные. Насколько сильно изменится? к 38 добавить пару-тройку самых отличающихся из 166.

История о том, как я в Debian машину времени вкрячивал

foss22 3 июл в 10:52

гибко настраивать параметры монтирования (например, индивидуальное сжатие для разных каталогов)

Зачем разное сжатие может понадобиться? Есть идеи? Понять могу отсутствие сжатия и сжатие для 2 каталогов (фильмы и jpg не жать). Но разная степень сжатия зачем?

Как же залюбил меня вайбкодинг и вот почему

foss22 3 июл в 09:41

Есть список таких контор? Хочется вайбкодить не заглядывая в код. Вместо тех кто любит заглядывать в код. Приветствую "как только меня заставят писать ллмками, я просто уйду"!

Как же залюбил меня вайбкодинг и вот почему

foss22 3 июл в 09:19

Ваши агенты ищут синтаксические и типизированные баги, но не логические.

Баги бизнес-логики агенты не умеют искать? Или всё же бывают такие агенты и SKILL?

JetBrains IDE: будущее не за горами

foss22 3 июл в 07:57

ни один разработчик, которого я знаю, не удалил IDE с рабочего компьютера

Если в Вашем информационном пузыре это так, то попробуйте найти тех кто удалил и тех кто даже не ставил. За ненадобностью. Изначально стартовав как разраб в терминале.

Сколько нужно примеров таких разработчиков, чтобы убедить, что IDE устарели как кареты и брички когда-то (в традиционном смысле, не в смысле IDE for AI Agent = автомобили)?

-13

silentjson v2.0.0: Уперлись в железо, или как мы выжали максимум из парсинга JSON в Go

foss22 3 июл в 01:05

Пишите свои бенчмарки в комментарии к этой статье.

Добавтье инструкцию по запуску бенчмарка.

Оптимизация парсинга без AVX2.

Интересует avx1 (aka avx-128) и neon в termux

Почему ИИ не снимает ответственность с разработчика: что изучать, чтобы оставаться актуальным специалистом

foss22 30 июн в 15:02

может показаться, что если ИИ пишет код, то учить язык программирования уже не обязательно. На практике всё наоборот. Чем больше кода пишет ИИ, тем важнее уметь этот код читать, понимать и проверять. Если разработчик не знает язык, стек, архитектурные паттерны и принципы проектирования, он не сможет отличить хорошее решение от плохого. Он будет принимать на веру всё, что сгенерировала модель. А это опасно.
ИИ может ошибаться. Может придумывать несуществующие API.

уметь этот код читать? Точно нужно? Много кода. Зачем? Ведь вы учите проверять тестами, разве эти тесты не поймают нагаллюцинированные апишки? Насколько снизилась ценность навыка читать код?

Бездумное использование ИИ ведёт к вырождению специалистов

foss22 30 июн в 13:42

Тот, кто никогда не был квалифицированными специалистами, впадает в эйфорию, воображая, что теперь он может решать задачи, не обладая необходимыми знаниями.

Почему воображая? Решают же задачи. Не обладая знаниями, а только доступом к модели. 10 раз из 10. Быстрее в разы, чем знающие.

Это будет работать до тех пор, пока действительно знающие люди стоят у руля разработок. А вот когда им на смену придут освоившие взаимодействие с ИИ, но не обладающие необходимой квалификацией для трезвой оценки результатов

Модели учатся не у тех кто стоит у руля.
Оценить результат большинстве случаев проще, чем реализовать сложную систему его достижения. Ракета попала в цель - оценить проще, чем спроектировать её.

-6

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет

foss22 30 июн в 13:18

к моменту публикации уже может частично устареть, или утечь

А как сделать не устаревающий и не утекающий бенч (принципиально)? *Со звёздочкой задача - сохранив при этом воспроизводимость (на уровне отдельных прошлых прогонов). Не публиковать месяцами закрытую часть проверочных данных (только доступ по API) - так себе выход - есть что получше?

берём минимальный чек-лист действий

Все 6 пунктов не страхуют от “бенчмаксинга”. Как застраховать?

Anthropic, OpenAI и Stripe хотят уничтожить простуду и грипп как явление

foss22 26 июн в 07:50

Менее процента это не стерильность - сразу смертельной заболеть риск тот же. Суперинфекция возникнет не в быту, а в больничках или сельхоз (антибиотики для набора веса).

Выезды на природу это от энцефалита прививаться надо, не городские инфекции. Другие страны - отдельные прививки, не пересекаются с экономикой заявленных этим фондом 5%.

Информация

Специализация