Tuesday, November 28, 2000

Social Engineering: gender determination on message text

The article is dedicated to the differences existing between men and women in vocabularies, sentence construction, the part of speech utilisation, slang, preferences in literature, which allow determining the author's sex of the message.

Социальная инженерия: определение пола по тексту сообщения
В этой статье будет сделана первая попытка систематического изложения методов "социальной" инженерии (транскрибированный англоязычный термин означающий прикладную психологию) применяемых как хакерами, так и годными на то, чтобы использовать в повседневной жизни. Применением психологических методик для атак компьютерных систем не гнушаются даже продвинутые хакеры. Тот же Кевин Митник многого достиг в первую очередь социальной инженерией. Эти навыки давно в ходу у криминалистов (криминальная психология), следопытов, сыщиков, спецслужб и иже с ними и без них...

Социальная инженерия в свою очередь подразделяется на два основных раздела: деликатные и агрессивные методы. Хотя, по сути, разница между ними как между "черной" и "белой" магией, и в самом грубом определении социальная инженерия называется "психофашизм". Я, естественно, пойду по "деликатной стезе". Это же обрушивается на, уже ничего не подозревающую, публику в виде надоедливой рекламы, игры на сексуальных инстинктах, оболванивании очередным "многоуровневым маркетингом". Так что, я в этом ряду просто зарвавшийся в своем любопытстве и наблюдательности "академический ученый"...

Толчком к написанию "моего творения" послужила статья Игоря Ворошилова "Как выбрать свой собственный НИК", опубликованная в 39 номере КГ за 3 октября. "В каждой шутке есть доля шутки", но за шутливой формой изложения, я увидел тезисы для построения анализа и проведения реконструкции ника, с целью определения пола, возраста, образования или психологического состояния обладателя псевдонима. Не знаю, приходила ли автору такая идея в голову? Но, "обратные задачи" некорректны по своей постановке и, в общем случае, допускают множественное решение. Психика человека, как и его речь вероятностна, поэтому, и к выводам, полученным в результате анализа текстов, необходимо относиться как к вероятностной оценке. И последнее: в статье, по возможности, я буду абстрагироваться от психоанализа и сексологии. Газета-то, компьютерная, и речь пойдет о текстах электронных документов, чатов, или, на крайний случай, пейджерных сообщений. Основные тезисы для удобства я свел в таблицу.

ПризнакОсобенности, преобладание в тексте
МужчиныЖенщины
Информационная избыточность Больше затрачивается слов на выражение мыслей одинакового содержания
Нововведения в языкеНеологизмы и термины, восприимчивость к новому языку, стремление изобретать новые слова, кличкиНейтральность. Устаревшие слова и обороты
ЭмоциональностьОписание действий, предметовОписание чувств, эмоций, психического и физиологического состояния
КонформизмНебрежность и раскрепощенность. Больше "ярлыков", кличек, прозвищ, унизительных обращений.Ориентировка на установленные обществом шаблоны и штампы. Избежание "панибратства".
Построение мышленияОпора на логику, здравый смысл, вербальное описаниеАссоциативность, образность мышления
ДетализацияВыдача "контура", схемы, основных моментов, детализация опускается или уходит в конец сообщенияОбстоятельность, порой патологическая, стремление выдать больше деталей
Объем словарного запасаПри равных условиях значительно выше 
Предпочтения в литературеПрозаПоэзия
Предпочтение в наукахТехнические, точные дисциплины, соответственно, склонность к "технократическому" подходу и описаниюГуманитарные дисциплины, соответственно, склонность к гуманитарному подходу и описанию
Частота употребления частей речиБольше существительных и глаголовБольше прилагательных, превосходных степеней, междометий, уменьшительных вариантов слов
СуществительныеАбстрактныеКонкретные
Залог глаголовАктивныйПассивный
Суффиксы Характерная тенденция к употреблению уменьшительных и ласкательных суффиксов
Обозначение цветовОсновные тонаОттенки, специфические названия
Отношение к объекту или событиюПреобладание утилитарности (полезность, абстрагирование от эмоций и контекста), агрессивная позицияПреобладание личностного отношения (симпатия, удовольствие), пассивная позиция, уступчивость
Описание маршрутаПри описании опора на направлениеПри описании опора на ориентиры, приметы
На степень проявления различий существенно влияют: социальное окружение, обстановка, в которой происходит общение, личность собеседника, профессия, образование и с повышением образовательного уровня различия в речи нивелируются.
Вместо послесловия
В статье признаки речевых особенностей полов даются только для людей с, так называемой, "традиционной сексуальной ориентацией". Различия для людей с аномальным поведением (я не смог подыскать более мягкое определение, чтобы не задеть самолюбие "сексуальных меньшинств") здесь не рассматривались.

С этим можно долго спорить, но у мужчин и женщин различия в мышлении, и речи, соответственно, столь сильны, что по меткому выражению одного психолога "они напоминают два, генетически совместимых, различных биологических вида, вынужденных уживаться и договариваться между собой". Как следствие этого, можно привести и тот факт, что "мужчина лучше поймет мужчину", и наоборот, женщина - женщину.

На речь человека накладывает отпечаток не только его пол, но возраст, раса, национальность, место рождения, образование, профессия. Не только взломом шифров и построением математических основ компьютерных систем, которыми мы пользуемся, и по сей день, но и этими проблемами занимался Алан Тьюринг (1912-1954) - английский математик и криптоаналитик, один из основателей кибернетики наряду с Клодом Шенноном и Норбертом Винером. Как у многих гениев у него была трагическая судьба. Попав под ложное обвинение в гомосексуализме, он был арестован, и поставлен судом перед выбором: или тюрьма или лечение. От годового лечения его психика пошатнулась, почти до полного одиночества сузился его круг общения. Те, на кого он работал (британский "большой брат"), не спускали с него глаз: он слишком много умел, и знал для преступника и сумасшедшего. 8 июня 1954 года он синтезировал цианистый калий. Так что, не следует слишком увлекаться анализом текстов...
Игра Тьюринга
В Технологическом институте Джорджии (Georgian Institute of Technology) США Джошуа Берман (Joshua Berman) использовал принципы Тьюринга для ведения исследования по социологии виртуальных сообществ и разработки программного обеспечения. Игра, доступная по адресу "http://www.cc.gatech.edu/elc/turing" в "реальном времени" может приблизительно просчитать пол, возраст и многое другое. Там же есть и поддержка чата для любителей интеллектуальных развлечений, где лучше владеть английским в совершенстве, чтобы не зачислили в "пятилетние папуасы" :). Правда, для специалистов по математической лингвистке этот сайт имеет минимальную ценность.