Articles / Bookmarks / Profile of 4eshirsky / Habr

4eshirsky @4eshirsky^{read⁠-⁠only}

User

ProfileComments9Bookmarks5

kucev Oct 19 2023 at 11:26

Разметка данных при помощи GPT-4

9 min

8.5K

Big Data*Data Mining*Artificial IntelligenceMachine learning*

Translation

Разметка данных — критически важный компонент проектов машинного обучения. К ней применима старая поговорка «мусор на входе — мусор на выходе». В процессе разметки создаются аннотированные датасеты для обучения и проверки. Однако этот процесс может быть длительным и дорогостоящим, особенно для проектов с большими объёмами данных. Но что если мы сможем воспользоваться прогрессом LLM для снижения затрат и усилий, необходимых для выполнения задач разметки данных?

GPT-4 — это современная языковая модель, разработанная компанией OpenAI. Она способна понимать запросы и генерировать текст, напоминающий составленный людьми. В этом посте мы расскажем о том, как можно использовать GPT-4 с целью настройки меток для различных задач. Это может существенно снизить затраты времени и труда, связанные с процессом разметки. Чтобы показать, как инжиниринг промтов способен помочь в создании точных и надёжных меток при помощи GPT-4 и как эту методику можно использовать для гораздо более мощных возможностей, мы воспользуемся примером с классификацией эмоционального настроя (sentiment classification).

Читать дальше →

vaily Nov 25 2019 at 10:36

Лицензии на сайты и интернет-сервисы в Китае

5 min

3.3K

Legislation in IT

Про это довольно много написано, но каждый из авторов (сознательно или по незнанию) упускает несколько важных моментов. В этой статье я хотел бы сии пробелы заполнить. Итак, вначале — немного ретроспективы.

Как известно, деятельность сайтов и вообще любая активность в интернете в КНР является объектом государственного регулирования. Это значит то, что без одобрения соответствующих органов (в настоящий момент — отдела пропаганды ЦК КПК, министерства промышленности и информатизации, Гостелерадио и т.д. — для каждого вида деятельности свой) вести деятельность в Интернет нельзя. На тему следующих разрешений мы и поговорим.

Читать дальше →

2Bad Mar 18 2007 at 19:11

Записки свитчера

3 min

IT-companies

Начну издалека, с того, что с компьютерами дружу очень давно и Windows использовал начиная с версии 3.0, если мне не изменяет память. Всегда считал Windows отличной операционной системой и был ее ярым защитником до прошлого лета.
Знакомство близкое с фирмой Apple началось год назад, когда купил себе iPod на 30 гигабайт, который хоть не смог вместить всю мою коллекцию музыки, но зато научил пользоваться плейлистами в iTunes, и сегодня я просто не понимаю, как можно хранить и искать музыку по другому.
В начале лета ко мне в гости пришли 2 фотографа, которые наперебой начали мне на www.apple.com показывать новый MacBook. Меня он, конечно, очень порадовал — как внешне, так и внутренностями. Через месяц, как только в ReStore появились MacBook, я его купил.

Читать дальше →

+74

214

jeston Apr 12 2013 at 07:35

В Excel 2013 появилась эффектная трёхмерная визуализация данных на карте

1 min

32K

Data Mining*

Для версий Office Professional Plus 2013 и Office 365 ProPlus в составе Excel появился эффектный инструмент GeoFlow, который добавляет возможности 3D-визуализации данных на карте в виде различных диаграмм с возможностями анимации — таким образом, табличный процессор получил некоторые отличительные черты геоинформационных систем таких как ArcGis или AutoCad Map. Скачать аддон и оценить его возможности можно здесь.

Суть работы GeoFlow должна быть понятна из скриншота выше и из видео-демонстрации под катом. Фактически, располагая некоторой географически распределенной информацией, автор книги Excel может привязать её к реальным координатам, выбрать способ визуализации (к примеру, столбиковые диаграммы) и сразу получить эффектную и действительно наглядную картинку.

Узнать подробности

+42

sotakone Aug 11 2007 at 22:08

Chrony — обезжиреный тайм-менеджмент

1 min

9.6K

GTD*

Практически все гуру селф-девелопмента советуют своим читателям вести так называемый таймлог — журнал, в котором фиксируется, на что расходуется рабочее время. Это довольно просто: вы записываете время начала и окончания каждого действия, а в конце дня анализируете журнал и делаете соответствующие выводы.
Плюсы такого тщательного контроля за собой я ощутил уже на третий день, но так же понял, что абсолютно отвык (и не хочу привыкать, что самое главное) пользоваться ручкой, тетрадкой и калькулятором. Было бы весьма неплохо иметь маленькую софтину, максимально упрощающую процесс ведения и анализа таймлога. А если она при этом не будет навязывать различные ToDo-списки, ремайндеры, кучу опций, календарей и отчетов, то будет вообще здорово.
После продолжительной борьбы моя созидательная натура взяла верх над врожденной ленью, в результате чего появилась Chrony.

Что в итоге получилось

+50

152

Разметка данных при помощи GPT-4

Лицензии на сайты и интернет-сервисы в Китае

Записки свитчера

В Excel 2013 появилась эффектная трёхмерная визуализация данных на карте

Chrony — обезжиреный тайм-менеджмент

Information

Specialization