Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Как и почти все файлы в биоинформатике, это файл типа TSV (текстовый формат с разделением табами).Кстати, почему? Ведь это дичайше неоптимально. Разве такие файлы чаще читаются людьми, а не программами?
У прокариотов в промоторе есть ТАТААТ блок. У эукариотов всё значительно сложнее и "стандартной" последовательности не существует, насколько я знаю.
Ну и индель длины не кратной 3 может натворить куда больше проблем, чем сотня точечных замен: удаление/добавление одной буквы ломает рамку считывания — и белок будет абсолютно неправильным. Для архиватора же выкинуть 1 букву или 3 имеет мало разницы.
Ой нет.
Там много разных факторов перемешано.
Генетика (наверняка)
Эпигенетика (наверняка)
Микробиом (весьма вероятно)
Привычки в еде (ну это типа здравый смысл)
При этом все эти факторы влияют друг на друга нелинейно.
Гуглить статьи:
"Dutch hunger winter epigenetics"
"Microbiome obesity"
basal metabolic rate genetic variance"

Со временем наша ДНК повреждается космическими лучами и ошибками копирования, поэтому ДНК, которую родители передают детям, немного отличается от их собственной.
Введение в геномику для программистов