Pull to refresh
4
0

Разработчик PL/SQL, Delphi

Send message

Серендипность тебя найдет

Reading time5 min
Views7.7K
image

Об авторе: Пол Букхайт — создатель Gmail и FriendFeed, партнер Y Combinator.

Инстинктивная (интуитивная) прозорливость, серендипность (англ. serendipity) — способность, делая глубокие выводы из случайных наблюдений, находить то, чего не искал намеренно.

Вот интересный комментарий из «Hacker News» к статье о том, как человек отклонил предложение работать в Google в начале его пути.

«Со мной в 1999 году была такая же история. Я понял, что Google гораздо круче, чем AltaVista, и лучше находит нужное, чем каталог Yahoo. Подумал: вот оно, будущее. И отправил им резюме на позицию, не связанную с развитием — хранение и обработка данных, и системное администрирование. Они дважды позвонили мне, но я убедил себя, что они всё равно бы меня не взяли — и поэтому не стал перезванивать.»


Независимо от того, насколько правильным было решение проигнорировать звонки от Google, причина этого игнорирования (страх отказа) — на самом деле, не очень хорошая.

У меня немного воспоминаний из старшей школы, но то, что осталось со мной надолго — связано с первым учебным днём в 11 классе. Наш учитель английского (кажется, его звали мистер Мэй) поделился с нами историей о том, что произошло с ним накануне вечером. Он вёл машину под дождём и заметил на обочине двух людей на велосипедах. Он остановился узнать, не нужна ли им помощь, и в итоге отвёз их к себе домой, дал сухую одежду, и они вместе с женой пригласили их на ужин. За столом те рассказали кучу удивительных случаев, которые произошли с ними в поездке через всю страну.

Это не очень драматичная история, но мне нравится её серендипность — как в плане пары, поездка которой проходила в приключениях, так и в отношении моего учителя, который увидел людей на дороге и пригласил их к себе в дом. Ничего из этого не было запланировано — они просто позволили этому случиться. Это было для меня вдохновением, потому что ощущалось как правильный способ жить, весёлый и интересный. Но при всём при том достаточно редкий.
Читать дальше →
Total votes 5: ↑3 and ↓2+2
Comments2

На чем разрабатывать Oracle разработчику в 2019-м году (и после)

Reading time12 min
Views44K

Некоторое время назад я в очередной раз сменил место работы. Новый работодатель был настолько любезен, что разрешил мне выбрать любую IDE, которая понравится, и оплатить лицензию (но в разумных пределах). Также (в кои-то веки) у меня были права администратора на рабочем компьютере, так что я мог ставить что угодно и пробовать сколько угодно. Я попробовал: Oracle SQL Developer, TOAD, Alt SQL Developer и (ВНЕЗАПНО!) IntelliJ IDEA (PL/SQL Developer не пробовал, но много работал раньше). Если вы регулярно пишете PL/SQL код, или хотя бы время от времени делаете запросы к Oracle Database, думаю, вам будет интересно почитать, к каким выводам я пришел.

Читать дальше →
Total votes 12: ↑9 and ↓3+6
Comments74

Как делается OpenSource: личный опыт

Level of difficultyMedium
Reading time17 min
Views38K

Я - автор двух пакетов, входящих более-менее во все дистрибутивы Linux: sane-airscan и ipp-usb.

Кроме того, sane-airscan входит во все основные дистрибутивы BSD (FreeBSD, NetBSD и OpenBSD) и в ChromeOS. ipp-usb в ChromeOS не взяли потому, что он написан на Go, а у них там очень жестко с размером исполняемых файлов, вместо этого они написали свое на Rust, но предпочли бы взять моё изделие, если бы могли. Совсем недавно появился порт ipp-usb на FreeBSD, вероятно, другие BSD тоже скоро подтянутся.

Вместе эти два пакета образуют стек "бездрайверного" сканирования документов для Linux и *BSD, а в перспективе нескольких лет, когда старые сканеры, наконец, вымрут, вероятно других драйверов и не останется.

Кроме того, ipp-usb делает возможным "бездрайверную" печать на USB-устройствах.

Здесь я хочу рассказать, каково оно, быть автором популярных OpenSource пакетов. Хоть эта работа и не принесла мне особых денег (на что я, впрочем, особо и не рассчитывал), она принесла мне бесценный опыт.

В целом, я полагаю, продвижение OpenSource пакетов структурно близко к продвижению на рынок программных продуктов. Занимаясь этой деятельностью, очень хорошо начинаешь понимать разницу между (1) написать программу, которая работает для меня (2) написать программу, которую можно назвать продуктом (3) вывести продукт на рынок.

Первое занимает гораздо меньше времени, чем второе. Второе - гораздо меньше времени, чем третье.

Читать далее
Total votes 394: ↑394 and ↓0+394
Comments71

Разбираем HTTP/2 по байтам

Level of difficultyMedium
Reading time24 min
Views33K

image


Откройте любую статью с обзором HTTP/1.1. Скорее всего, там найдётся хотя бы один пример запроса и ответа, допустим, такие:


GET / HTTP/1.1
Host: localhost

HTTP/1.1 200 OK
Date: Sat, 09 Oct 2010 14:28:02 GMT
Server: Apache
Content-Length: 38
Content-Type: text/html; charset=utf-8

<!DOCTYPE html>
<h1>Привет!</h1>

Теперь откройте статью с обзором HTTP/2 или HTTP/3. Вы узнаете о мультиплексировании запросов, о сжатии заголовков, о поддержке push-технологий, но вряд ли увидите хоть одно конкретное сообщение. Ясно, почему так: HTTP/1.1 — текстовый протокол, тогда как сиквелы к нему бинарные. Это очевидное изменение открывает дорогу ко множеству оптимизаций, но упраздняет возможность просто и доступно записать сообщения.


Поэтому в этой статье предлагаю покопаться в кишках у HTTP/2: разобрать алгоритмы установки соединения, формат кадров, примеры взаимодействия клиента с сервером.

Читать дальше →
Total votes 115: ↑115 and ↓0+115
Comments45

Сбер открывает доступ к нейросетевой модели ruGPT-3.5

Level of difficultyEasy
Reading time3 min
Views45K

? Upd. Добавили пример запуска в Colab'е.

Друзья, свершилось. Сегодня мы рады сообщить вам о релизе в открытый доступ нейросетевой модели, которая лежит в основе сервиса GigaChat.

Про то, что такое GigaChat и как мы его обучаем, вы можете прочитать в нашей предыдущей статье. Скажу лишь, что главной его частью, ядром, порождающим креативный ответ на ваш запрос, является языковая модель обученная на огромном количестве разнообразных текстов — сотен тысяч книг, статей, программного кода и т.д. Эта часть (pretrain) затем дообучается на инструкциях, чтобы лучше соответствовать заданной форме ответа. Обучение такого претрейна занимает около 99% от всего цикла обучения и требует значительного количества ресурсов, которыми обычно обладают только крупные компании.

Этот претрейн, названный ruGPT-3.5, мы выкладываем на Hugging Face под лицензией MIT, которая является открытой и позволяет использовать модель в коммерческих целях. Поговорим о модели подробнее.

Читать далее
Total votes 86: ↑82 and ↓4+95
Comments100

Что нужно знать про оперативную память: тактовая частота, пропускная способность, тайминги, классы (DDR) и многое другое

Reading time10 min
Views151K

Привет, Хабр! Сегодня мы поговорим про оперативную память, про то, какие ее типы можно свободно купить в магазине для сборки ПК или его модернизации. Под катом рассказ об отличиях разных типов ОЗУ друг от друга, о разгоне и охлаждении памяти, а также несколько мыслей о том, имеет ли значение, какую планку памяти стоит установить в конкретный компьютер, чтобы добиться оптимального сочетания быстродействия, энергоэффективности и стоимости. Этот пост будет интересен тем, кто не считает себя DDR-гуру и при выборе памяти не уверен на 100% какие именно нужны тайминги, типы и характеристики модулей.

Читать далее
Total votes 31: ↑21 and ↓10+17
Comments50

Судебная психологическая экспертиза: поиск истины или инструмент террора?

Level of difficultyMedium
Reading time13 min
Views5.5K

Дисклеймер №1. Давайте сразу оговоримся, что статья полностью выдумана, примеры являются продуктом творчества, а все совпадения с реальностью случайны. Прошу считать её выдумкой в стиле SCP-foundation.

В предыдущих статьях я несколько раз упоминал, что достаточно глубоко интересовался темой психологического манипулирования и воздействия на личность и даже пытался развивать IT-стартап в этом направлении (о чем писал здесь). Но мой интерес не ограничивался исключительно академическими увлечениями – я был практиком и изучал «врага» с разных сторон: и ходил во все доступные места, где могут «промыть мозги» (об этот тут), а также принимал участие в ряде экспертиз, направленных на выявление деструктивного потенциала экстремистских материалов, и принимал решение – можно ли считать это вещественным доказательством в суде или нет?

И, в связи с большим количеством громких дел, участие в которых принимают психологи и деструктологи (и такое сейчас появилось), я решил сделать обзор своего опыта и задаться такими вопросами: как проходят такие экспертизы, что из себя представляют, какие условия выдвигают, что требуют и можно ли посадить человека за сказку «Колобок»? Ответы вы сможете получить в данной статье (или хотя бы приблизиться к ним).

Долго и скучно читать
Total votes 29: ↑22 and ↓7+20
Comments14

Большое сравнение нейросетей

Level of difficultyMedium
Reading time11 min
Views25K

Привет, меня зовут Юля, 85GB и я веду свой канал по нейронкам

В этой статье я рассмотрю по различным параметрам графические нейронки: DALL-E 2, Midjourney, Stable Diffusion, Кандинский и Шедеврум. Постараюсь разложить всё максимально чётко и ёмко, дать оценку по каждому блоку от 0 до 5. А потом всё сведу в одну таблицу. Штош, поехали. Содержание (кликабельно):

Читать далее
Total votes 43: ↑38 and ↓5+46
Comments48

Три способа отладки T-SQL кода

Level of difficultyEasy
Reading time4 min
Views10K

Написание нового кода = ошибки. С этим всё просто.

Избавится от ошибок – вот это сложная задача.

Программисты привыкли, что в их средствах разработки есть встроенные инструменты, показывающие, какая строка кода сейчас работает, отображают текущее содержимое переменных, выводят сообщения о процессе выполнения и т.д. Какое-то время в SQL Server Management Studio тоже был отладчик кода, но, начиная с версии SSMS v18, он был удален. Хотя даже когда отладчик был, я не фанател от него: SQL Server буквально мог прекратить обработку других запросов, пока выполнял ваш запрос. Это была катастрофа, особенно когда ваш запрос блокировал других пользователей, и всё это происходило на рабочей базе.

Мне бы хотелось, чтобы у нас был простой способ отладки T-SQL на рабочей базе без блокировок, но отладка T-SQL отличается от отладки в C#. Так что если ваш T-SQL код делает не то, что вы ожидали, вот несколько хороших способов для его отладки.

Читать далее
Total votes 10: ↑10 and ↓0+10
Comments16

Странный мир путей файлов в Windows

Reading time6 min
Views68K

Пути файловых систем в Windows страннее, чем можно подумать. В любой производной от Unix системе пути на удивление просты: если нечто начинается с /, то это путь. Но всё совершенно иначе в Windows, которая имеет озадачивающее разнообразие схем составления пути.

Когда я реализовал функцию автозавершения пути в Fileside 1.7, мне нужно было изучить этот вопрос внимательнее, чтобы ничего не упустить. В этой статье я расскажу о своих находках.

Стоит заметить, что статья ограничивается только тем типом путей, который видит пользователь приложений Windows (обусловленный Win32 API). Под этим слоем есть ещё больше любопытного, в основном касающегося тех, кто пишет драйверы оборудования и тому подобное.
Читать дальше →
Total votes 178: ↑178 and ↓0+178
Comments100

Как получить доступ к chatGPT в России

Reading time4 min
Views1.5M

Всем привет! Перед началом статьи сразу скажу:

САМЫЙ ВАЖНЫЙ ДИСКЛЕЙМЕР: естественно, покупая смс на чужой номер вы полностью компрометируете безопасность своего аккаунта. Мало ли кто его потом еще купит для получения доступа. Поэтому, помните, что представленный в данной статье способ получения доступа - это только на "поиграться". Не стоит вводить туда свои реальные почты и использовать это в работе, так как полученный доступ может быть в любой момент взломан/прикрыт.

Но да ладно, приступим. Здесь без всякого объяснения того что такое ChatGPT - кому надо тот знает. В этой статье я хочу поделиться путем который вас за 30Р может к этому боту привести. Вдаваться в детали бота я не хочу, это чисто статья для ребят которые хотят без лишних запар пройти путь человека который доступ к боту уже получил :)

Как и многих вокруг, меня удивила новая технология от Open AI. Попытался зайти и зарегистрироваться через гугл, но...

Читать далее
Total votes 68: ↑62 and ↓6+67
Comments268

Подробная пошаговая инструкция как настроить сервер на Linux и подключение по API к ChatGPT. Для Python и Node.js

Level of difficultyEasy
Reading time9 min
Views13K

ChatGPT набирает все большую популярность, ведь он может помочь человеку или даже заменить его в ряде задач. С ним можно взаимодействовать не только через графический интерфейс, но и по API. Таким образом его можно встраивать в свои системы, чтобы решать практические задачи бизнеса. Сейчас реализую подобный проект. Решил написать статью, где подробно и пошагово описываю, как настроить сервер Linux (Ubuntu) для интеграции по API с данной нейросетью, на примере Python (Flask) и Node.js (Next.js). Опять же, вы можете использовать не Ubuntu, не Flask и не Next.js, просто адаптировав примеры под себя.

В данной статье описано, как развернуть демо проект от OpenAI (описание здесь: Build your application), а затем доработать его, чтобы задавать свои собственные произвольные вопросы, в том числе и на русском. Также в конце статьи скажу немного про параметры API запросов и модели. Все команды и действия будут из консоли.

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments2

OpenAssistant: Вышла бесплатная открытая альтернатива ChatGPT

Level of difficultyEasy
Reading time3 min
Views52K

Участники открытого сообщества LAION-AI выпустили в открытый доступ первые обученные модели OA_SFT_Llama_30B и OA_SFT_Llama_13B. и запустили ИИ-чатбот OpenAssistant на их основе. На текущий момент доступны модели в 13 и 30 млрд параметров, дообученные на мультиязычных датасетах, собранных сообществом. В основе моделей лежит уже успевшая стать популярной LLaMA.

OpenAssistant - это диалоговый помощник на базе ИИ, который понимает задачи, может взаимодействовать со сторонними системами (подобно плагинам в ChatGPT) и динамически извлекать информацию из них. OpenAssistant позиционируется как открытая альтернатива ChatGPT.

"Мы хотим, чтобы OpenAssistant стал единой, объединяющей платформой, которую все другие системы используют для взаимодействия с людьми." - декларируют своё видение члены сообщества LAION.

Вы можете попробовать поговорить с OpenAssistant уже сейчаст тут.
Еще вы можете принять участие в формировании датасета на своём языке тут.

Читать далее
Total votes 44: ↑42 and ↓2+55
Comments121

ЛЛаМы на Эльбрусе

Level of difficultyEasy
Reading time2 min
Views6K

Всем привет! Возможно, вы уже знаете о проекте LLaMA.cpp (на Хабре по этой теме был цикл новостей от @bugman). В самом репозитории никаких ссылок на модели не даётся, только указание на необходимые ресурсы. И ресурсы, надо сказать, немалые.

Читать далее
Total votes 18: ↑17 and ↓1+24
Comments24

Dolly 2 — открытый аналог ChatGPT со свободной лицензией

Level of difficultyEasy
Reading time9 min
Views20K

В конце марта 2023г., компания Databricks выпустила Dolly, большую языковую модель, подобную ChatGPT, дообученную на платформе Databricks Machine Learning Platform. Результат оценки работы модели Dolly показывает, что модель с открытым исходным кодом двухлетней давности (GPT-J) при дообучении на публичном датасете, собранном в Стэнфорде (Stanford Alpaca), на небольшом наборе данных из 50 000 диалогов (вопросов и ответов), может демонстрировать удивительно высокое качество обучения, не характерное для родительской модели (GPT-J), на которой она основана.

Но с первой версией модели Dolly существует одна проблема - датасет от Stanford Alpaca был собран с помощью автоматизированных скриптов от ChatGPT, что нарушает лицензию и правила использования моделей OpenAI.

Чтобы исправить эту проблему, в апреле 2023г. Databricks выпустила
Dolly 2 - большую языковую модель с открытым исходным кодом и открытой лицензией для научных и коммерческих целей.

Dolly 2 - это языковая модель с 12 млрд. параметров, основанная на семействе моделей EleutherAI pythia и дообученная исключительно на новом датасете высокого качества, созданном сотрудниками Databricks с использованием RL from Human Feedback (RLHF).

Databricks открыли исходный код Dolly 2, включая код обучения, сам датасет и веса модели, подходящие для коммерческого использования. Это означает, что любая организация может создавать, владеть и настраивать комплексные модели, не платя за доступ к API или передавая данные третьим сторонам.

Читать далее
Total votes 27: ↑25 and ↓2+30
Comments9

Запуск аналогов ChatGPT на домашнем ПК в пару кликов и с интерфейсом

Level of difficultyEasy
Reading time6 min
Views215K

--- Обновление статьи 9 Августа 2023 ---

В течении последнего полугода в сфере текстовых нейронок всё кипит - после слитой в сеть модели Llama, aka "ChatGPT у себя на пекарне" люди ощутили, что никакой зацензуренный OpenAI по сути им и не нужен, а хорошие по мощности нейронки можно запускать локально.

Основная проблема в том, что всё это требует глубоких технических знаний.

Но в этой статье я расскажу, как запустить добротную нейросеть на домашнем ПК с 16ГБ ОЗУ в несколько кликов. Буквально в несколько кликов - копаться в консоли не придётся.

Читать далее
Total votes 117: ↑116 and ↓1+142
Comments180

Решаем проблему галлюцинаций LLM с помощью алгоритма фрактального синтеза ответа

Level of difficultyEasy
Reading time8 min
Views8.9K

Мы с командой разрабатываем FractalGPT — проект самообучающегося ИИ на базе больших языковых моделей(LLM) и логического вывода (reasoning). В этой статье мы расскажем о разработанном нами новом подходе, который называется fractal answer synthesis. Фрактальный синтез ответа позволяет существенно уменьшить уровень «галлюционирования» LLM и, как следствие, является важным шагом к решению проблемы фактологии генеративных нейросетей. По сути подход позволяет перейти от простого векторного представления текста(базы знаний) к его фрактальному представлению — более сложной структуре, инкапсулирующей внутри себя дополнительные «смыслы», которые в содержатся в тексте. В статье мы кратко описали преимущества и недостатки подхода, показали алгоритм построения «фрактального графа», представили принципиальную схему алгоритма и результаты тестирования на нашей базе знаний — статьях и книгах.

Читать далее
Total votes 14: ↑14 and ↓0+14
Comments18

Безопасный Wi-Fi в отеле для всей семьи на Raspberry Pi

Level of difficultyMedium
Reading time7 min
Views15K

Всем привет! Сегодня хочу рассказать о своем «семейном» проекте на Raspberry Pi. Путешествуя по миру, я постоянно сталкиваюсь с потребностью подключаться к быстрому и, что не менее важно, безопасному интернету.

Читать далее
Total votes 12: ↑12 and ↓0+12
Comments19

Обучаем с помощью LlamaIndex и OpenAI GPT-3 отвечать по вашей базе знаний

Level of difficultyEasy
Reading time7 min
Views21K

От переводчика.

У меня накопилось куча всяких там данных, документов, pdf, doc, видосов на ютюбе, которые я бы хотел проиндексировать, и чтобы можно было по этой базе знаний у нейронки что-нибудь спрашивать.

Так же статья может пригодиться, если вы хотите собрать базу знаний по какой-то компании и затем заставить нейронку отвечать на вопросы пользователей. Например, чтобы ИИ прочитала кучу скучной документации, регламентов работы и прочего.

Пока выбираю, на чем это лучше сделать. Вот наткнулся на нижеследующий вариант, который решил попробовать.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments5

ПасТильда: ещё одна прошивка

Level of difficultyMedium
Reading time7 min
Views5.3K

Существует очень своеобразный прибор Пастильда. Это аппаратный хранитель паролей. Было продано нескольких сотен таких устройств. С 2017 года этот проект стал Open Source(ным). Я составил еще одну прошивку для Пастильды (плата Pas~ r 1.1).

Если у вас есть Пастильда или отладочная плата Olimex-STM32-H407, то я могу прислать вам прошивку аппаратного менеджера паролей с расширенным функционалом.

Читать далее
Total votes 12: ↑8 and ↓4+7
Comments54

Information

Rating
6,326-th
Date of birth
Registered
Activity

Specialization

Software Developer, Database Developer
Lead