Как стать автором
Обновить
32
0
Sergey Aganezov @Karde

Genomics Scientist

Отправить сообщение

5 разных библиотек Python, которые сэкономят ваше время

Время на прочтение5 мин
Количество просмотров22K

В этой подборке, переводом которой мы решили поделиться к старту курса о машинном и глубоком обучении, по мнению автора, каждая библиотека заслуживает отдельной статьи. Всё начинается с самого начала: предлагается библиотека, которая сокращает шаблонный код импортирования; заканчивается статья пакетом удобной визуализации данных для исследовательского анализа. Автор также касается работы с картами Google, ускорения и упрощения работы с моделями ML и библиотеки, которая может повысить качество вашего проекта в области обработки естественного языка. Посвящённый подборке блокнот Jupyter вы найдёте в конце.

Читать далее
Всего голосов 27: ↑20 и ↓7+13
Комментарии12

Как использовать Python для «выпаса» ваших неструктурированных данных

Время на прочтение8 мин
Количество просмотров18K
Здравствуйте, уважаемые читатели.

В последнее время мы прорабатываем самые разные темы, связанные с языком Python, в том числе, проблемы извлечения и анализа данных. Например, нас заинтересовала книга «Data Wrangling with Python: Tips and Tools to Make Your Life Easier»:



Поэтому если вы еще не знаете, что такое скрепинг, извлечение неструктурированных данных, и как привести хаос в порядок, предлагаем почитать перевод интересной статьи Пита Тамисина (Pete Tamisin), рассказывающего, как это делается на Python. Поскольку статья открывает целую серию постов автора, а мы решили пока ограничиться только ею, текст немного сокращен.

Если кто-то сам мечтает подготовить и издать книгу на эту тему — пишите, обсудим.
Читать дальше →
Всего голосов 15: ↑14 и ↓1+13
Комментарии10

JavaScript исполняется 25 лет: краткая история языка и скидка 50% на WebStorm

Время на прочтение2 мин
Количество просмотров5.6K

25 лет назад, 4 декабря 1995 года JavaScript был впервые представлен миру. Мы хотим отметить день рождения языка и поблагодарить вас за его поддержку все эти годы, поэтому мы подготовили для вас небольшой сюрприз!


js-25-picture

Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии8

Графическое описание владения и заимствования в Rust

Время на прочтение2 мин
Количество просмотров14K

Ниже представлено графическое описание перемещения, копирования и заимствования в языке программирования Rust. В основном, эти понятия специфичны только для Rust, являясь общим камнем преткновения для многих новичков.



Чтобы избежать путаницы, я попытался свести текст к минимуму. Данная заметка не является заменой различных учебных руководств, и лишь сделана для тех, кто считает, что визуально информация воспринимается легче. Если вы только начали изучать Rust и считаете данные графики полезными, то я бы порекомендовал вам отмечать свой код похожими схемами для лучшего закрепления понятий.


Читать дальше →
Всего голосов 57: ↑57 и ↓0+57
Комментарии36

В Elite: Dangerous все больше странных объектов и сигналов

Время на прочтение3 мин
Количество просмотров50K

Секретные коды, неизвестные объекты, пугающие сигналы — все это может быть предвестником грядущего вторжения




Космический симулятор Elite: Dangerous официально доступен на ПК уже около 19 месяцев (на Xbox One — около 9 месяцев). Игроки освоили только небольшую часть огромнейшего игрового пространства с 400 000 000 000 звезд. Разработчики не раз и не два заявляли о том, что в ходе освоения игровой вселенной геймеры будут встречать странные объекты. Больше всего этих объектов в безымянной галактике, которую пока что никто так и не нашел. Но странности уже начали проявляться.

Не идентифицированные артефакты («unknown artifacts») встречаются игрокам в течение нескольких месяцев. Их находят, в основном, около звездной системы Merope, в пределах 50 световых лет от звезды. Эти артефакты передают странные сообщения кораблям, которые подходят поближе для сканирования. Сообщения закодированы, и сейчас группе игроков удалось их раскодировать — оказывается, это изображения космических кораблей самих игроков. Артефакты, насколько можно судить, вызывают проблемы при попытке их собрать — некоторые системы выходят из строя, иногда прекращают работать целые космические станции. Это случается, если артефакт продать на черном рынке станции. Все это более-менее известно. Но сейчас появился второй тип неизвестных объектов.
Читать дальше →
Всего голосов 41: ↑35 и ↓6+29
Комментарии42

Видео со встречи JUG.ru с разработчиками языка Kotlin Андреем Бреславом и Дмитрием Жемеровым

Время на прочтение1 мин
Количество просмотров15K


Неделю назад в Питере прошла встреча JUG.ru с разработчиками языка Kotlin Андреем Бреславом и Дмитрием Жемеровым. Как вы все наверняка знаете, Kotlin зарелизился пару недель назад, и теперь, спустя почти шесть лет разработки, пришла пора поговорить о том, что в итоге получилось.

В пятничный вечер 26 февраля народу в питерский офис Oracle набилось дофига, что очень обрадовало и нас и спикеров.



Встреча состояла из четырех частей:
  • Введение. Что такое Kotlin?
  • Kotlin: к релизу и далее
  • Kotlin: самое сложное — совместимость
  • Сессия вопросов и ответов про Kotlin

Читать дальше →
Всего голосов 35: ↑31 и ↓4+27
Комментарии45

«…И высосут всю энергию из Солнца»

Время на прочтение2 мин
Количество просмотров31K

Городок Вудленд в Северной Каролине запретил устанавливать рядом солнечные панели, потому что они «убьют растения» и «высосут всю энергию из Солнца»


Экологически чистая энергетика иногда сталкивается с неожиданными препятствиями. Кто мог подумать, что против неё выступят простые американцы, а основанием для критики станет вред природе? В такое трудно поверить, но именно это произошло на городском собрании небольшого города Вудленд (шт. Северная Каролина), где недавно прошли общественные слушания по проекту установки солнечной электростанции, пишет местная газета Roanoke Chowan News Herald.

Жители Вудленда, в том числе учительница на пенсии Джейн Манн (Jane Mann), высказались против предложения. Миссис Манн была особенно убедительна, не зря ведь она преподавала физику и химию в школе. Учительница объяснила собравшимся, что установка солнечных батарей угрожает фотосинтезу окружающих растений, который зависит от солнечного света. Если фотосинтез прекратится, то растения перестанут расти.
Читать дальше →
Всего голосов 65: ↑53 и ↓12+41
Комментарии136

Сравнение Microsoft Office под Windows и Mac c позиции офисного использования: на что обратить внимание

Время на прочтение10 мин
Количество просмотров180K
В данной заметке хотел бы поделиться личным опытом непосредственного сравнения Microsoft Office под Windows и Mac; постараюсь обобщить большинство вопросов и нюансов, возникающих при обдумывании как индивидуального перехода, так и перевода организаций и групп.

Свой индивидуальный опыт я считаю достаточно репрезентативным в связи с тем, что являюсь профессиональным пользователем Microsoft Office с 1996 года. Я профессионально как автор, рецензент и редактор с 1996 года ежедневно (может быть, разве что за исключением дня свадьбы) вынужден находиться в Microsoft Office буквально круглосуточно. За день через меня проходят примерно 25-30 файлов Word и 15-20 файлов Powerpoint, содержащих любые возможные функции, т.е. достаточно больших и сложных (Word, как правило, не менее 200 страниц; Powerpoint, как правило, не менее 70 слайдов). За прошедшие 14 лет я попробовал все имевшиеся версии Microsoft Office на всех имевших место версиях Windows. Надеюсь, что обратившие на себя мое внимание особенности будут репрезентативны для более «мягких» сценариев. Хотелось внести некоторую ясность, т.к. с одной стороны сама Microsoft и большинство деловых пользователей в США утверждают о полной совместимости, в то время как в рунете в большинстве случаев можно услышать противоположное.
Читать дальше →
Всего голосов 80: ↑72 и ↓8+64
Комментарии51

Молекулярный компьютер 3000000 вековой давности

Время на прочтение5 мин
Количество просмотров44K
Говорят, что все изобретения человечества были «подмечены» у природы, или хотя бы имеют природные аналоги; например, у самолёта в природе есть аналог — птица. А есть ли аналог компьютера и компьютерных программ?
Это — биологическая клетка, которая и будет рассмотрена в этом посте с точки зрения программиста, как молекулярный компьютер. Вы узнаете, что многие современные способы и алгоритмы обработки информации появились не в 1980-х годах, а на многие миллионы лет раньше.

Читать дальше →
Всего голосов 125: ↑117 и ↓8+109
Комментарии73

Практическая биоинформатика ч.5. Секвенирование ДНК

Время на прочтение6 мин
Количество просмотров12K
    В стремлении рассказать о самом сложном, как можно быстрее, очевидно, забываешь о самом простом. И, в моем случае, не только о простом, но и о важном связывающем звене. Причинно-следственная связь слегка нарушилась. В моих предыдущих статьях (1, 2, 3, 4) описаны математический аспект и программирование, но в них практически нет биологии. Поэтому эта статья о том, какую именно часть молекулярной биологии пытаются раскрыть, предсказать, увидеть и решить описываемые мною программы и алгоритмы.
Читать дальше →
Всего голосов 34: ↑34 и ↓0+34
Комментарии16

Практическая биоинформатика ч.4. Готовимся работать с ZINBA

Время на прочтение7 мин
Количество просмотров7.1K
bioinformatic    В современном мире анализа данных использовать только один метод или только один подход означает, что рано или поздно ты столкнешься с фактом, как сильно ты ошибался. Для анализа данных комбинируют различные методики, сравнивают результат и на основании сравнения уже делают более точные прогнозы. В программе ZINBA использован именно такой подход. Разработчики объединили разнообразные методы анализа DNA-seq экспериментов в едином пакете. Этот пакет написан для программы статистической обработки данных R. Что же делает ZINBA? Находит различные обогащенные регионы даже в тех случаях, когда некоторые из них были усилены, например, химически или имеют разную степень соотношения сигнал-шум.
Читать дальше →
Всего голосов 16: ↑16 и ↓0+16
Комментарии6

Практическая биоинформатика ч.3. Оценка значимости экспериментальных данных

Время на прочтение9 мин
Количество просмотров6.1K
    На каждом этапе эксперимента, начиная от подготовки материала, продолжая проведением PCR и заканчивая секвенированием, происходит накопление ошибки. Нам нужен механизм оценки значимости результата. Какова вероятность, что риды, оказавшиеся на некотором участке генома, оказались там неслучайно? Подход, представленный в этой статье, применим для данных, полученных с помощью DNA-seq, и рассказывает о возможности применения распределения Пуассона для оценки значимости.
Читать дальше →
Всего голосов 17: ↑17 и ↓0+17
Комментарии11

Практическая биоинформатика ч. 2

Время на прочтение8 мин
Количество просмотров5.3K
    Эта статья расскажет о том, как обработать данные, полученные после pipeline, выходом которого будет sam/bam файл[1], создать несложный bed graph файл (http://genome.ucsc.edu/FAQ/FAQformat.html) и просмотреть его с помощью UCSC genome browser[2]. Очень сложно решиться, на чем писать программы, ибо уже есть огромное количество чужих наработок и совсем не хочется сочинять колесо там, где этот этап уже пройден. Долго мучаясь, я решил остановиться на C++, хотя Python и R рассматривались на равных. Также сохранилась идея, что может понадобиться графика, да ещё и под Linux, поэтому к С++ прибавилось Qt. Надеюсь, в этой статье я расскажу достаточно подробно о всем выше перечисленном, чтобы ответить на вопрос, заданный мне в начале пути и озвученный в первой части повествования.
Читать дальше →
Всего голосов 45: ↑40 и ↓5+35
Комментарии20

Практическая биоинформатика

Время на прочтение5 мин
Количество просмотров10K
    Обнаружил жесткую нехватку информации по биоинформатике в русском сегменте. Не знаю, уж, востребована она или нет, но хочу предоставить на суд читателя вводную часть, которую можно назвать практическая биоинформатика, которой мне очень не хватало для ознакомления с предметом. В этой главе я хочу описать путь, который пришлось пройти мне до настоящего момента, когда я уже не шарахаюсь от фраз: вот вам FASTQ файл и постройте мне bed graph для genome browser. Чтобы в дальнейшем вести разговор об интересном, хочу по диагонали пройтись по определениям и программам первичной обработки данных, без которых трудно говорить на одном языке.
Читать дальше →
Всего голосов 37: ↑37 и ↓0+37
Комментарии15

У сокращалки ссылок от Google появился полноценный API

Время на прочтение1 мин
Количество просмотров8.5K
В сентябре, когда мы запустили сервис сокращения ссылок, для него ещё не было сопутствующего API, чтобы позволить людям интегрировать goo.gl в свои приложения и веб странички. Однако, как мы говорили, что работаем над этим, и сегодня рады вам сообщить, что запустили полноценный goo.gl API доступный в Google Code Labs. Документация расположена на сайте Google Code, с примерами кода в секции Getting Started.

С этим API, разработчики могут программно получить доступ ко всем быстрым, гладким вкусняшкам, которые доступны через веб интерфейс. Вы можете сокращать и разворачивать URLы используя API, а также получать историю и аналитику. Вы сможете использовать эти возможности для широкого спектра приложений, начиная от автоматического сокращения ссылок в Twitter или Google Buzz клиентов запуская процесс мониторинга статистики и данные трафика. Для начала вы можете ознакомится с консолью Google API.

Мы очень рады возможности предоставить вам наш API для доступа к одному из самых быстрых сервисов сокращения ссылок. Мы продолжаем работать над некоторыми улучшениями юзабилити и возможностью автоматического определения спама или вредоносного контента. Мы надеемся, что с новым API, вы найдете место для goo.gl в своей будущей деятельности. Если вы являетесь разработчиком, ознакомьтесь с документацией по goo.gl API и посмотрите как это все работает.
Читать дальше →
Всего голосов 60: ↑53 и ↓7+46
Комментарии13

Краткая заметка по некоторым дополнительным возможностям Kindle третьего поколения

Время на прочтение7 мин
Количество просмотров28K

В заметке я постараюсь начать описание нескольких интересных дополнительных возможностей этой замечательной читалки,. Речь пойдет о вариантах Kindle 3g и Kindle Wi-fi третьего поколения и некоторых штуках, не описаных в мануалах. Хотел бы заметить, что информацию о Киндле найти относительно не сложно, однако собрать все в одной заметке на русском, думаю, неплохая идея.

приступим
Всего голосов 127: ↑116 и ↓11+105
Комментарии117

Делаем Desire HD из Desire

Время на прочтение5 мин
Количество просмотров17K


Буквально пару дней назад я прочитал пост Вторая жизнь HTC HD2 и задумался, а можно ли сделать Desire HD из моего Desire? Как оказалось, можно, и даже не очень сложно. В общем, поразмыслив некоторое время о плюсах и минусах перехода на HD, я приступил к превращению. После всех действий я получил все возможности Desire HD в корпусе Desire. Никаких проблем и ошибок не возникло.
Читать дальше →
Всего голосов 109: ↑96 и ↓13+83
Комментарии139

OAuth: описание протокола простым и понятным языком

Время на прочтение16 мин
Количество просмотров190K
OAuth — популярный протокол, который позволяет социальным сервисам интегрироваться между собой и дает безопасный способ обмена персональной информацией. OAuth может связать между собой 2 сервиса, каждый из которых имеет свою пользовательскую базу — именно их я в данном случае называю «социальными». Когда начинаешь работать с OAuth, первое ощущение — что протокол весьма сложен и избыточен. В этой статье я попытаюсь объяснить основы OAuth человеческим языком.

Пример кросс-авторизации


Вернемся в 2005-й год и представим, что мы пишем социальную сеть. В ней имеется форма импорта контактов из адресной книги GMail. Что нужно для доступа к контактам GMail? Конечно, логин и пароль от ящика. Но если мы попросим ввести их на нашем сайте, пользователь заподозрит неладное. Где гарантия, что мы не сохраняем на сервере введенные пароли? Поэтому нам хочется, чтобы пароль вводился только на сайте GMail, и после этого доступ к контактам через API GMail предоставлялся нашей социальной сети (возможно, на время).
Под катом - повествование с примерами
Всего голосов 134: ↑124 и ↓10+114
Комментарии34

Немецкое правительство выложило все законы на гитхаб в machine-readable формате

Время на прочтение1 мин
Количество просмотров6.8K


github.com/bundestag/gesetze

Все законы можно найти в формате Markdown. Теперь граждане страны могут получать доступ к самым свежим текстам законов и отслеживать изменения.

Можно делать pull-реквесты, но только законы, которые одобрены голосованием в бундестаге, будут приняты…

/via news.ycombinator.com/item?id=4353389
Всего голосов 106: ↑104 и ↓2+102
Комментарии70

Как обращаться с данными пользователей на платформе Android

Время на прочтение4 мин
Количество просмотров877
С ростом использования мобильных приложений люди обращают все больше внимания на то, как эти приложение используют их данные. Несмотря на то, что платформа Android использует различные разрешения разработанные для защиты пользователей, разработчики приложений ответственны за то, как они используют данные пользователей. Немаловажно, чтобы разработчики понимали, какой код они подключают, и хорошенько обдумывали запрашиваемые разрешения, так как в случае неправильного использования можно потерять доверие пользователей.
Построение здравой и доверительной экосистемы является приоритетом каждого разработчика на платформе Android.
Давайте рассмотрим несколько пунктов для написания приложения, которому будут доверять:
1. Используйте соглашение о конфиденциальности (privacy police)
2. Минимизируйте число запрашиваемых разрешений
3. Предоставляйте своим пользователям выбор при сборе информации
4. Не собирайте ненужную информацию
5. Не отправляйте никакой пользовательской информации с устройства
6.… однако, если это действительно необходимо, используйте шифрование и минимизируйте количество передаваемой информации
7. Не используйте код который вы не понимаете
8. Не ведите логов устройств или информации по конкретным пользователям
Читать дальше →
Всего голосов 21: ↑14 и ↓7+7
Комментарии3

Информация

В рейтинге
Не участвует
Откуда
Cambridge, Massachusetts, США
Дата рождения
Зарегистрирован
Активность