Статьи / Закладки / Профиль KonstantinKG / Хабр

Konstantin Kuzminov @KonstantinKG

ML, DL, Online Marketing

Профиль Публикации 1Комментарии 8Закладки 42

itsoft 8 фев 2022 в 07:37

ЕГРЮЛ, доходы и расходы, налоги, количество сотрудников в XML и JSON бесплатно

7 мин

33K

Big Data*Открытые данные*Законодательство в ITФинансы в ITБлог компании ITSOFT

Налоговая отдаёт данные ЕГРЮЛ по организации в виде PDF. Посредники за автоматический доступ по API хотят денег. На многих сайтах часть данных закрыто, часть функций недоступны бесплатно, и полно рекламы.

Особенно интересно, что на некоторых сайтах предоставляющих данные по API имеется логотип Сколково. Это такой высокотехнологический бизнес, наверное, открытые данные продавать.

Налоговая просит 150 000 рублей в год за доступ к данным ЕГРЮЛ в виде сваленных в архивы XML-файлов. У ФНС классный бизнес. Вы проявляйте должную осмотрительность при выборе поставщиков, но доступ к данным за деньги. Если вы хотите получить доступ и к реестру индивидуальных предпринимателей (ЕГРИП), то платите ещё 150 000 рублей в год. Согласитесь 300 000 рублей в год приличная сумма.

Остальные реестры данных у налоговой доступны бесплатно. Однако, без базы ЕГРЮЛ их вряд ли можно использовать. Самая частая операция в бизнесе подставить реквизиты из ЕГРЮЛ по ИНН.

Сформировалась целая отрасль, можно сказать, торговцев ~~воздухом~~ открытыми данными, создающих ВВП из воздуха как бухгалтеры, работающие руками там, где должны работать программы. Сколько компаний платит налоговой по 300 000р. в год?! Сколько программистов занято написанием одинаковых по функциям парсеров, которые переводят данные из XML налоговой в SQL и JSON?! Сколько серверов заняты под одинаковые функции?! Где добавочная стоимость? Все вроде при деле, а за чей счёт банкет?

Ну, ладно, “скандалить, критиковать каждый может”(с) как говорил бессмертный товарищ Райкин. “А что ты предлагаешь?” — резонно вы меня спросите. А я вам отвечу.

+160

139

ipolfirst 2 янв 2022 в 11:22

«Что делаешь?»

6 мин

12K

Веб-разработка*Разработка мобильных приложений*Яндекс API*Социальные сети и сообщества

Привет, Хабр! С Новым Годом!

Смотрите сами, надо оно вам или нет?

Придумал кое-что для Яндекса и хотел его руководству это подарить(не продать), но до них не дотянуться, они там в танке, все эти службы поддержки на игноре и всё такое. Короче, не хотят, как хотят.

Забыл бы и двинул дальше, но, на мой взгляд, это кое-что может и народу понравиться и пригодиться. Поэтому сами решайте, нужен вам такой подарок или нет. Его, если что, можно и на любой другой площадке создать, сбер, например, или там озон-амазон-алибабазон.

Держите, с Новым Годом, так сказать ;)

+11

jenezis 16 июн 2015 в 19:33

IT-эмиграция в Ригу, Латвия

7 мин

72K

Карьера в IT-индустрии

Здравствуйте, дорогие хабровчане! Давно собирался рассказать о своем опыте переезда из Украины в Латвию. Я веб-программист, родом из славного города Запорожья, в Украине. Решил, посмотреть мир и набраться опыта работы в других странах мира.

Сложных путей не искал, создал резюме на английском языке и подал его в HR-компанию, предварительно указав свои пожелания. Одно из которых отсутствие языкового барьера, так как с английским языком у меня не все так радужно, как хотелось бы… Предложения сыпались одно за другим, буквально через неделю получил предложение от крупной международной компании Accenture. Предложили работу в Латвийском филиале.

Читать дальше →

+23

104

ZlodeiBaal 21 апр 2021 в 02:14

Тихая революция и новый дикий запад в ComputerVision

7 мин

33K

Анализ и проектирование систем*Алгоритмы*Обработка изображений*Блог компании RecognitorМашинное обучение*

Технотекст 2021

Казалось бы, революция с Computer Vision уже была. В 2012 году выстрелили алгоритмы основанные на сверточных нейронных сетях. Года с 2014 они дошли до продакшна, а года с 2016 заполонили все. Но, в конце 2020 года прошел новый виток. На этот раз не за 4 года, а за один. поговорим о Трансформерах в ComputerVision. В статье будет обзор новинок, которые появились в последний год.

+103

Quintanar 17 фев 2021 в 12:50

Как выучить иностранный язык: алгоритм

13 мин

158K

Лайфхаки для гиковМозгИзучение языков

Если вы хоть немного пересекались с Machine Learning, то понимаете, что человеческий мозг — это, по сути, большая нейросеть. А раз так, то и работу с ним можно строить по известным в ML алгоритмам. Так я нашел универсальный способ выучить любой иностранный язык до нормального уровня в разумные сроки. И на себе проверил его эффективность.

+62

123

Yoker 26 янв 2021 в 08:42

Фургоны-детекторы ТВ всё ещё колесят по улицам Великобритании

13 мин

74K

Читальный залИстория ITНаучно-популярное

Возможно, вы не знали, но Соединённое Королевство требует от каждой семьи, которая пользуется телевизором, приобретать лицензию на эту привилегию. Появившаяся в 1923 году после принятия Закона о беспроводной телеграфии лицензия требовалась всем, кто пользовался радиоприёмниками. В 1946 году под лицензирование попало и телевидение. Средства, собираемые с граждан, используются в качестве основного источника финансирования Британской общенациональной общественной телерадиовещательной организации. Если коротко, то BBC.

+126

406

makishvili 31 янв 2020 в 11:12

Доклад «42». Большой конспект

23 мин

26K

Блог компании ЯндексКарьера в IT-индустрииМозгЗдоровье

Привет, Хабр, меня зовут Вадим Макишвили. В 2014 году я выступил с докладом «36». Рассказывал про кризис среднего возраста, признавался в собственных слабостях и делился способами, которые помогли мне совладать со страхами. Сразу после выступления друзья стали надо мной подтрунивать, мол, давай каждые десять лет по продолжению. Я отшучивался, мол, обязательно сделаю. Но, вообще-то, не собирался, потому что каждые десять лет рассказывать всему миру про свои страхи — скучно.

Однако несколько месяцев назад на конференции YaTalks в Екатеринбурге я выступил с новым докладом. В заголовке число 42, и возникает вопрос: «Неужели Макишвили — автор одной темы?» Нет. Самокопания не было. А что было? И можно ли «42» считать продолжением «36»?

Мой рассказ имеет отношение к предыдущей лекции лишь косвенно. В «42» я детально обдумываю тему, которой тогда едва коснулся. Но если кому-то удобнее думать, что «42» — вторая серия, пусть так. Тогда впереди ещё и третья, которая не будет иметь ничего общего ни с первой, ни со второй, ну разве что автор — я, и название тоже окажется каким-то числом.

«42» — точно не про кризис среднего возраста.

— Здравствуйте, друзья. Мне очень много хочется вам рассказать. Так много, что первая версия этого доклада длилась два часа. Но организаторы сказали мне — Макишвили, не наглей. Короче, вы со мной здесь на час. Я постараюсь, чтобы вам не было ни скучно, ни грустно.

Читать дальше →

+42

veselipjan 17 ноя 2020 в 17:56

Тренируемся дома: отжимания по программе Пола Уэйда

21 мин

245K

Читальный залЗдоровье

Перевод

Представляю программу Тюремных Тренировок Пола Уэйда. Начнём с серии классических упражнений со своим весом для верхней части тела — отжиманиям.

Тюремные Тренировки представляют собой самые лучшие и эффективные методы обучения работе со своим весом, из когда-либо существовавших. Многие из этих забытых, но действенных техник находятся на грани исчезновения. Современный бодибилдинг меняет наше мышление, навязывая свои убеждения. И даже заключённые сейчас получили доступ к тренажёрным залам.

Серия сосредоточена на цепочке из 10 последовательных упражнений. Когда освоите одно упражнение, то перейдёте к следующему и так далее…
Мы называем базовые упражнения как «10 уровней», и достигнув 10 уровня, вы станете сильнейшим настолько, насколько это возможно для человека в этих движениях. По этой причине, последняя ступень именуется «уровнем мастера». Вам станет понятнее, как это работает, если дополнительно ознакомитесь с книгой Тренировочная Зона (Издательство Питер).

Читать дальше →

+117

198

sismetanin 3 ноя 2020 в 14:35

Определение токсичных комментариев на русском языке

16 мин

16K

Python*Блог компании VKМашинное обучение*Социальные сети и сообщества

Сегодня социальные сети превратились в одну из главных коммуникационных платформ как в онлайне, так и реальной жизни. Свобода выражения разных точек зрения, в том числе токсичных, агрессивных и оскорбительных комментариев может иметь долговременные негативные последствия для мнений людей и социальной сплочённости. Поэтому одной из важнейших задач современного общества является разработка средств автоматического определения токсичной информации в интернете для уменьшения негативных последствий.

В этой статье описывается решение этой задачи для русского языка. В качестве источника данных мы использовали анонимно опубликованный на Kaggle набор данных, дополнительно проверив качество аннотации. Для создания классифицирующей модели мы сделали тонкую настройку двух версий Multilingual Universal Sentence Encoder, Bidirectional Encoder Representations from Transformers и ruBERT. Настроенная модель ruBERT показала F₁ = 92,20 %, это был лучший результат классификации. Мы выложили в открытый доступ обученные модели и примеры кода.

Читать дальше →

+26

oulenspiegel 22 окт 2020 в 10:00

Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ

10 мин

173K

Блог компании СберМашинное обучение*Искусственный интеллектNatural Language Processing*Блог компании SberDevices

Последнее десятилетие в области компьютерных технологий ознаменовалось началом новой «весны искусственного интеллекта». Впрочем, ситуацию в индустрии в наши дни можно, наверное, охарактеризовать уже не как весну, а полноценное «лето ИИ». Судите сами, за последние неполные 10 лет только в области обработки естественного языка (Natural language processing, NLP) произошли уже две настоящие технологические революции. Появившаяся в результате второй из них модель GPT-3 произвела настоящий фурор не только в технологических медиа, но стала знаменитой далеко за пределами научного сообщества. Например, GPT-3 написала для издания «The Guardian» эссе о том, почему ИИ не угрожает людям. GPT-3 сочиняет стихи и прозу, выполняет переводы, ведёт диалоги, даёт ответы на вопросы, хотя никогда специально не училась выполнять эти задачи. До недавних пор все возможности GPT-3 могли по достоинству оценить лишь англоязычные пользователи. Мы в Сбере решили исправить эту досадную оплошность. И сейчас расскажем вам, что из этого получилось.

Источник изображения

Читать дальше →

+155

241

itsoft 6 окт 2020 в 10:45

Одностраничный устав ООО с двумя директорами электронно и открытие счёта в банке дистанционно

6 мин

14K

Развитие стартапаЗаконодательство в ITБлог компании ITSOFT

Надоело заморачиваться с доверенностями, банками, судами, госорганами и решили прописать в Устав второго директора. Плюс заодно избавиться от дурацкого большого устава давно было желание, чтобы не копировать толстый устав на тендеры и крупным заказчикам. Но коллеги говорили, что будет не солидно, возникнут вопросы при рассмотрении устава юристами контрагентов, которые должны оправдывать свою зарплату. И всё как-то не решались. Но год назад решились. Сделали одностраничный устав. Кстати, в поиске в Яндекс.Картинках не нахожу одностраничного устава в электронном виде. Наш первый значит будет. Год прошёл — полёт нормальный, проблем нет. Солидность не пострадала. Банк устав принял, второго директора признал. Хотя тупил страшно. Дальше о том, что должно быть в одностраничном Уставе, какие трудности были с регистрацией в налоговой и с банком. Мы всё хотели сделать принципиально в электронном виде и удалённо.

+29

onokonem 2 окт 2020 в 15:05

Коллеги, вы меня огорчаете

12 мин

170K

Блог компании Конференции Олега Бунина (Онтико)Go*Управление персоналом*

В июле и августе 2020 года я, с подачи Григория Петрова, проводил для компании Evrone технические интервью на позицию Senior Golang Backend developer. И, видимо, буду вынужден продолжать проводить, о чём ниже.

Задача формулировалась как «найти человека, который сможет задать и поддерживать высокий уровень профессионализма в применении языка Go». То есть, сформулирована она была по-человечески, перевод на канцелярит — мой. Под эту задачу я сформировал новый опросник вместо того, которым пользовался несколько лет — старый был с жестким закосом под DevOps. Методику, которой я пользуюсь для создания опросников и количественной оценки соответствия кандидатов, я излагал в своем докладе «Техническое интервью как инженерная задача» на конференции Saint TeamLead 2019.

И вот что я хочу сказать вам, коллеги: вы меня огорчаете.

Читать дальше →

+93

1152

SvetBolgova 29 сен 2020 в 23:23

Как защищать авторские права, чтобы не чувствовать себя беспомощным идиотом

11 мин

12K

Creative Commons*Законодательство в ITПатентование*Копирайт

Я не совсем беспомощная и могу защитить себя, если соседи сожгли мне дом или работодатель нарушает трудовое законодательство. У меня отличный юрист, который не слил ни одной проблемы, за которую брался. Но когда доходит до авторских прав, я впадаю в кому. Не считала, сколько раз я встречала в сети свои тексты, сколько планов публикаций и образовательных программ я «подарила» «нерешительным» работодателям, а однажды моя фотография в стиле Half-Life 2 на билборде целый месяц рекламировала магазин одежды.

Но думать о том, чтобы устроить разборку «чей совочек», так тошно, что я даже не пыталась никогда что-то с этим сделать. А послушав друзей, быстро поняла, что про «срочно в суд!» болтают те, у кого не было никакого реального опыта. Кому действительно случалось судиться, вспоминают это как травматичный и крайне разорительный эксперимент, говорить о нем не любят и повторять не хотят.

Но тут мне попалась история, как Максим Ильяхов без шума, пыли и обмороков взял и отстоял права на книгу «Пиши, сокращай» у «инфобизнесмена с Бали» Даниила Галта. Не сам отстоял, конечно, с юристами, но смог, выжил и получил с грабителя 300 тысяч за упущенную выгоду и вред деловой репутации.

Читать дальше →

+23

122

arttom 24 сен 2020 в 19:11

В IT растет цензура, а мы не замечаем — разрешают только улыбаться и молчать

8 мин

125K

Законодательство в ITКарьера в IT-индустрииIT-компании

У меня есть две статьи-интервью вот с такими странными абзацами. За обоими кроются неприятные истории для меня и для людей, про которых я писал.

+463

1526

snakers4 17 сен 2020 в 19:48

Мы опубликовали современные STT модели сравнимые по качеству с Google

2 мин

Big Data*Машинное обучение*Развитие стартапаЗвук

Технотекст 2020

Мы наконец опубликовали наш набор высококачественных пре-тренированных моделей для распознавания речи (т.е. сравнимых по качеству с премиум-моделями Google) для следующих языков:

Английский;
Немецкий;
Испанский;

Вы можете найти наши модели в нашем репозитории вместе с примерами и метриками качества и скорости. Мы также постарались сделать начало работы с нашими моделями как можно более простым — выложили примеры на Collab и чекпойнты для PyTorch, ONNX и TensorFlow. Модели также можно загружать через TorchHub.

	PyTorch	ONNX	TensorFlow	Качество
Английский (en_v1)	✓	✓	✓	ссылка
Немецкий (de_v1)	✓	✓	✓	ссылка
Испанский (es_v1)	✓	✓	✓	ссылка

Читать дальше →

+36

usix 3 сен 2020 в 15:54

AWS — сколько нужно сервисов, чтобы поднять веб-приложение?

4 мин

17K

Amazon Web Services*

Из песочницы

Так получилось, что до 2020 года я не имел дело с облаками. Когда же, наконец, углубился в эту тему, то немного потерялся от обилия сервисов, предлагаемых в AWS.

Необходимо было создать приложение с такими фичами:

Авторизацией через facebook или google.
Возможностью загрузки и отображения медиа-файлов.
Получением событий с сервера в реальном времени.

В этой статье описаны сервисы, которые понадобились мне для реализации проекта и ощущения от процесса.

Читать дальше →

+25

scalywhale 21 авг 2020 в 18:39

[Личный опыт] Amazon vs Microsoft: чем отличается процесс собеседований в крупных ИТ-компаниях

7 мин

23K

IT-эмиграцияКарьера в IT-индустрииИнтервьюIT-компанииБлог компании getmatch

Привет, Хабр! Меня зовут Паша Доронин и бóльшую часть жизни я работаю в индустрии переводов и локализации. Я долгое время проработал в компании Smartcat, где прошел путь от аналитика до менеджера по продукту. Несколько месяцев назад я переехал в Дублин и решил заняться дальнейшим развитием своей карьеры.

На этот раз я решил сменить схему поиска вакансий – раньше я просто смотрел на то, «что есть», и выбирал интересные варианты. Теперь же хотелось исходить из того, что хочу получить на новом месте я, и уже соответственно фильтровать объявления. За период активного поиска я связался с 17 компаниями из Европы и США, и устроился в AI-стартап Intento (недавно поднял новый раунд инвестиций). Вот что я понял по итогам этого процесса.

Читать дальше →

+25

jia3ep 9 авг 2020 в 21:40

Три редко используемых возможности Python 3, о которых каждый должен знать

3 мин

13K

Python*Программирование*

Перевод

Python 3 существует уже какое-то время и довольно много разработчиков, особенно те, кто только начинает свой путь в Python, уже используют эту версию языка. Несмотря на то, что множество новых возможностей широко используются, похоже, что некоторые остались за кадром. В этой статье я расскажу о трех наименее известных, но полезных, возможностях. Я знаю о них из других языков и они делают Python 3 классным.

Данная статья является переводом 3 Neglected Features in Python 3 That Everyone Should Be Using.

Читать дальше →

SLY_G 27 июл 2020 в 10:00

Как работает доказательство Гёделя

8 мин

74K

Математика*Научно-популярное

Перевод

Его теоремы о неполноте разгромили поиск математической теории всего. Почти сто лет спустя мы всё ещё пытаемся осмыслить последствия этого.

В 1931 году австрийский логик Курт Гёдель провернул, вероятно, один из самых потрясающих интеллектуальных трюков в истории.

Математики той эпохи искали неколебимые основы математики: набор базовых фактов, аксиом, которые были бы непротиворечивыми и полными, играя роль строительных блоков всех математических истин.

Однако шокирующие теоремы Гёделя о неполноте, опубликованные им всего лишь в 25-летнем возрасте, разбили эту мечту. Он доказал, что любой набор аксиом, который вы можете предложить на роль основы математики, неизбежно будет неполным. Всегда найдутся истинные утверждения, касающиеся чисел, которые невозможно будет доказать при помощи этих аксиом. Он также показал, что ни один набор аксиом нельзя использовать для доказательства их собственной непротиворечивости.

Читать дальше →

+99

346

editor_ruvds 25 июл 2020 в 12:12

Расшифровка: почему у монетизаторов нет души, а токсичные члены команды — самые эффективные

33 мин

24K

Разработка игр*Блог компании RUVDS.comМонетизация игр*Управление продуктом*Дизайн игр*

Наверное, это один из самых откровенных прямых эфиров, которые мы проводили, причем с представителем двух самых ненавидимых профессий в геймдеве: монетизатором и менеджером.

7 июля в нашем инстаграм-аккаунте выступил Вячеслав Дреер, гейм-дизайнер и продюсер игр с 12-летним стажем. Слава работал в игровых подразделениях веб-мани, mail.ru, Фотостраны и принимал участие в более, чем 50 других проектов.

Во время эфира он без буллшита и увиливаний рассказал:

как погибают интересные игры с плохой монетизацией и как монетизаторы превращают такие проекты в прибыльные
почему иногда монетизация важна самим игрокам
почему нельзя делать справедливые игры, где у всех равные возможности
почему не стыдно всю жизнь остаться середнячком, а не стать гением
почему нельзя отправлять на конференции лучших сотрудников
почему игровой программист — главный человек в геймдеве
что это за люди, вливающие в онлайн-игры по миллиону рублей в месяц
почему нельзя увольнять токсичных людей и как они могут быть самыми эффективными людьми в команде
как стрессоустойчивость помогает вырасти в зарплате на целые порядки

Делимся с вами расшифровкой.

+32

141

2 3