Все потоки
Поиск
Написать публикацию
Обновить
23
0
Анастасия Васильева @facedancer

Пользователь

Отправить сообщение
Итюнс тоже не хавает…
Однажды такую бяку схватили: работал и с квипом, и с асей, и с мирандой. И периодически в конец письма The Bat’ом добавлялся. Так сказать, универсальный солдат.
Я в своё время переболела (и перезаразила пол-листа) подобной заразой, которая отправляла ссылку на какую-то «открытку». Дрянь работала и с аськой, и с квипом, и с мирандой, и добавлялась в письма, отправляемые через The Bat! Причём первым эту ссылку прислал мне молодой человек на «день влюблённых». Вот и говорите после этого о доверии.
Один раз чуть не попалась снова на такую же фигню, когда другой знакомый так же неожиданно для себя рассылал сообщения про «эстонских фашистов». Но там — было видно, что работа робота. А когда идёт ссылка на какой-то cards.funnystories.ru и смайлик рядом, так сразу и не сообразишь.

…с тех пор, если приходят ссылки от друзей на незнакомые сайты, сначала переспрашиваю, действительно ли они мне что-либо посылали.
«Все беды дизайнеров-фрилансеров(в дальнейшем фрилансеров), проистекают от недостатка мотивации. Даже чтоб разобраться в том, что мешает спокойно делать свою работу, тоже нужна мотивация.»
В точку!
Вообще говоря, дороговато будет по сравнению с тем же netprint’ом.
Там цены всё же более приемлемые. Что касается доставки — до Новгорода за неделю дошли.
“quasi” — якобы, как будто, как бы, почти. И читается это как «квази».
То есть буквально это можно перевести как «как бы/почти универсальная… единица». Тут, по-моему, по одному названию видно, что это прикол :)
Не то чтобы я упускала это из виду, просто исследование велось как раз на уровне максимальной абстракции, на основе имеющихся данных о статистических различиях по буквам и их сочетаниям.
Планирую взять более конкретные разработки данной темы для магистерского диплома, поэтому огромный интерес представляют комментарии хабралюдей :)
Спасибо за комментарий.
Дело в том, что сравнение по N-граммам показывает довольно сильные различия между авторами, и там легко видны характерные черты. Я предполагала, что энтропия более высокого порядка может служить некоторым характерным значением для текста, так как она учитывает именно не просто статистическое распределение символов, а зависимости между ними. Собственно, такой вариант виделся очень удобным — один текст (автор, период творчества автора) — одна характеристика (некоторая, вероятно нечёткая или на худой конец интервальная, оценка средней энтропии), что приводило бы к существенной экономии на базе данных и трудоёмкости сравнения. Однако получилось, что чем выше уровень рассматриваемых связей, тем более чувствительно значение к репрезентативности выборки (что, собственно, ожидалось, но не в таких масштабах), и о стаблизации значения на небольших выборках не может быть и речи. Разброс же значений энтропий высокого порядка на больших объёмах даёт сходную картину.
Тем не менее, вопрос авторской инварианты остаётся в силе. К сожалению, я ещё не разобралась с методами анализа текстов пословно, в частности с игнорированием словоформ, но возможно именно этой темой займусь в будущем.
Что же касается пунктуации, то это не кажется мне яркой характеристикой авторского текста, отому что, во-первых, большинство авторов всё-таки приедживаются общеустановленных правил в этой области, и во-вторых, это та область, в которой большое значение имеет редакторская правка. Однако если использовать пунктуацию для разбиения текста на блоки с последующим анализом их сложности, это может действительно дать интересную картину.
Интересный вариант, но любой грамотный плагиатчик будет производить с текстом некоторые более сложные изменения, и далеко не всегда исходный текст известен.
Энтропийные тесты (основанные на архивировании, а не прямом подсчёте, как в моём случае) применялись в частности для анализа авторства «Тихого Дона» — то есть в условиях, когда даны некоторые другие, не связанные с данным текстом произведения разных авторов (Шолохов, Крюков), и необходимо выявить схожесть авторского стиля. На высоком уровне этим занимаются лингвисты и филологи, а данная статья — пример самого низкого уровня определения авторских закономерностей.
Вот интересная статья по данной тематике: http://www.voppsy.ru/issues/1989/891/891…
Насколько я вникала в эту тему, Лингвоанализатор подсчитывал похожесть сразу по большому количеству признаков, среди которых как энтропийные, так и чисто статистические (типа процентного соотношения служебных слов), а потом уже по их совокупности подбирал наиболее близкий вариант. Весьма разумный подход :)
Я сначала хотела добавить определение в начало топика, но потом передумала. Возможно, всё-таки ошиблась.

В теории информации энтропия — это мера неопределённости. Она вычисляется по формуле , где p — вероятности появления символов.
Смысл энтропии в том, что она численно равна среднему количеству информации, которую несёт один символ данного текста, в битах. В рамках одного алфавита энтропия максимальна для генератора случайных букв с равномерным распределением, и минимальна (нулевая) для генератора, возвращающего один неслучайный символ. В реальном языке частота букв различна, поэтому энтропия меньше максимального значения; кроме того, вероятность появляения каждого символа зависит от предыдущих, и поэтому вводят условную энтропию 2,3 и т.п. порядка.
Энтропия текста — это некоторое приближение к энтропии языка, при котором мы вместо вероятностей используем относительные частоты появления символов в данном тексте.
С этим утверждением я совершенно согласна.
Ну так патриархальные устои и различие ролей М и Ж тоже не с потолка взяты, а обусловлены различиями между теми и другими. Если М более приспособлен для решения задач и обеспечения выживания, то Ж — для поддержания порядка и социальных взаимодействий. Так что пока мужчины разгадывали тайны мироздания, женщины воспитывали мужчин, и нет в этом ничего постыдного. Прекрасно, что сейчас гораздо проще тем и другим лучше проявить свои природные качества, широкие возможности для творчества, организации социальных групп, и относительная несложность их реализации.
Заказала себе "PHP 5. Практика создания Web-сайтов"
http://www.ozon.ru/context/detail/id/2273374/

Посему вопрос: если заказанная книга будет признана дорогой или отсутствовать в наличии, может ли компания/магазин прислать другую, но на эту же тематику?
Я надеюсь они подумали о том, чтобы "болванкам для слепых" ещё наклейки на поверхность сделали, как на жидких дисплеях. А то представляю, как человек берёт болванку и начинает её щупать со всех сторон в поисках заветной надписи.
Таких билетов всего 720.
12 ...
10

Информация

В рейтинге
Не участвует
Откуда
Новгородская обл., Россия
Дата рождения
Зарегистрирована
Активность