Pull to refresh
0
Артём@Frohman

User

Send message

Подтверждаю. Вчера было около 300, сегодня от 50 до 100 кбайт/сек.

Как, как... да инфрой конечно. Google gemini, google grounding, google URL context, google deep research, google maps grounding, google file search, google document processing, google context caching, code execution, computer use, batch, logs, safety и ещё. И всё это для ИИ.

Меня всегда интересует, почему в каналах официальных лиц нельзя ставить дизлайки?

Вот мне интересно, если не хранить фотки, то как обновлять вектора в базе при смене модели на новую?

Представители оператора заявляют, что переход на LTE повышает скорость мобильного интернета на 20–25% и расширяет доступ абонентов к современным цифровым сервисам, включая технологию передачи голоса VoLTE

Реклама 2012 года? Назад в светлое будущее?

Сижу на LG 38" 38WK95C-W с 75Гц и вполне доволен. Более крутые модели могут либо 5К, либо 144Гц. И ни то, ни то мне не нужно.

Вместе с этой другая новость:

Президент утвердил перечень поручений по итогам встречи с представителями российских деловых кругов, прошедшей 26 мая 2025 года.
...

б) представить предложения:

...

о введении дополнительных ограничений на использование в Российской Федерации программного обеспечения (в том числе коммуникационных сервисов), произведенного в недружественных иностранных государствах;

без дополнительных костылей в виде транспортных приложений просто прикладываешь банковскую карту (или телефон) к турникету и проходишь. Можно даже лицом платить - привязываешь биометрию и ничего не нужно носить.

Можно пополнить транспортную карту через приложения банков - указываешь сумму, прикладываешь карту к телефону и готово, можно пользоваться. Если NFC нет, то сумму активируешь у терминала.

Правда где-то посередине. Не так давно Яндекс.Букмейт поделился своими технологиями по озвучке книг. В какой-то момент они заметили, что существует достаточно высокий спрос на озвучку, даже если она не профессионального качества (а типа той, что у робота boston dynamics в русской озвучке). Их текущая технология лично на меня произвела очень хорошее впечатление, но в итоге я всё равно не смог так слушать книги (аудиокниги не мой любимый формат). Спрос на такое есть, профессиональная озвучка это дорого и долго - сгенерированная позволяет сделать приемлимое качество намного быстрее и дешевле.

Вы сами же в предыдущем комментарии к статье "Как протестировать производительность СУБД перед миграцией: опыт K2Тех" задаёте дополнительные вопросы авторам, чтобы ответить. Ваши желания и ограничения должны быть заданы в инструкции модели. Закинул в deepseek ваш вопрос, дописал, что он должен уточнять вопрос, если он ему не понятен. И получил ваши же вопросы в том посте и вопросы Politura выше. Модель не читает ваши мысли, часть информации из вопроса только в вашей голове.

Сначала заменит джунов, потом мидлов, а потом уже и за сеньоров возмётся :)

Серьёзно? Вот вам кусочек расчётов стоимости инференса

По данным Artificial Analysis (https://artificialanalysis.ai/models), пропускная способность GPT-4o – 95 tok/s, что находится между LLama 3.1 7b (182 tok/s) и 70b (80 tok/s). Для наших целей предположим, что в 4o 100 миллиардов активированных параметров, делая скидку на то, что в OpenAI инференсом занимаются крайне толковые люди. Кстати, Gemini Flash 1.5 с последним обновлением выдаёт (https://artificialanalysis.ai/models/gemini-1-5-flash) 330 tok/s. Амортизированная стоимость сервера с 8 H100. Чтобы не сильно расстраиваться, возьмём оценку сверху как цену такого сервера на AWS (https://aws.amazon.com/ec2/capacityblocks/pricing/) – на сегодняшний день $39.33 в час. На рынке цены могут быть минимум в пять раз меньше. MFU – какой процент вычислений используется эффективно. Стандартом является 30-50%, для наших прикидок возьмём 30%. При таких допущениях (а с другими вы можете поиграть в колабе), стоимость инференса миллиона токенов получается $0.23. Сравним это с официальной ценой в $2.5 за input и $10 за output и получим наценку API в ~50 раз. И это – оценка сверху со всеми допущениями в сторону удорожания.

в o1 показывается нечто типа саммари по рассуждениям, а не сами рассуждения.

Жду с нетерпением!

к этой статье большие вопросы у сообщества.

Он ещё и подорожал неслабо с недавних пор.

Правдивость и точность информации будет определять Министерство Правды?

1
23 ...

Information

Rating
Does not participate
Location
Москва и Московская обл., Северная Корея
Registered
Activity