Социальная инженерия: определение пола по тексту сообщения
В этой статье будет сделана первая попытка систематического изложения методов "социальной" инженерии (транскрибированный англоязычный термин означающий прикладную психологию) применяемых как хакерами, так и годными на то, чтобы использовать в повседневной жизни. Применением психологических методик для атак компьютерных систем не гнушаются даже продвинутые хакеры. Тот же Кевин Митник многого достиг в первую очередь социальной инженерией. Эти навыки давно в ходу у криминалистов (криминальная психология), следопытов, сыщиков, спецслужб и иже с ними и без них...
Социальная инженерия в свою очередь подразделяется на два основных раздела: деликатные и агрессивные методы. Хотя, по сути, разница между ними как между "черной" и "белой" магией, и в самом грубом определении социальная инженерия называется "психофашизм". Я, естественно, пойду по "деликатной стезе". Это же обрушивается на, уже ничего не подозревающую, публику в виде надоедливой рекламы, игры на сексуальных инстинктах, оболванивании очередным "многоуровневым маркетингом". Так что, я в этом ряду просто зарвавшийся в своем любопытстве и наблюдательности "академический ученый"...
Толчком к написанию "моего творения" послужила статья Игоря Ворошилова "Как выбрать свой собственный НИК", опубликованная в 39 номере КГ за 3 октября. "В каждой шутке есть доля шутки", но за шутливой формой изложения, я увидел тезисы для построения анализа и проведения реконструкции ника, с целью определения пола, возраста, образования или психологического состояния обладателя псевдонима. Не знаю, приходила ли автору такая идея в голову? Но, "обратные задачи" некорректны по своей постановке и, в общем случае, допускают множественное решение. Психика человека, как и его речь вероятностна, поэтому, и к выводам, полученным в результате анализа текстов, необходимо относиться как к вероятностной оценке. И последнее: в статье, по возможности, я буду абстрагироваться от психоанализа и сексологии. Газета-то, компьютерная, и речь пойдет о текстах электронных документов, чатов, или, на крайний случай, пейджерных сообщений. Основные тезисы для удобства я свел в таблицу.
Признак | Особенности, преобладание в тексте | |
Мужчины | Женщины | |
Информационная избыточность | Больше затрачивается слов на выражение мыслей одинакового содержания | |
Нововведения в языке | Неологизмы и термины, восприимчивость к новому языку, стремление изобретать новые слова, клички | Нейтральность. Устаревшие слова и обороты |
Эмоциональность | Описание действий, предметов | Описание чувств, эмоций, психического и физиологического состояния |
Конформизм | Небрежность и раскрепощенность. Больше "ярлыков", кличек, прозвищ, унизительных обращений. | Ориентировка на установленные обществом шаблоны и штампы. Избежание "панибратства". |
Построение мышления | Опора на логику, здравый смысл, вербальное описание | Ассоциативность, образность мышления |
Детализация | Выдача "контура", схемы, основных моментов, детализация опускается или уходит в конец сообщения | Обстоятельность, порой патологическая, стремление выдать больше деталей |
Объем словарного запаса | При равных условиях значительно выше | |
Предпочтения в литературе | Проза | Поэзия |
Предпочтение в науках | Технические, точные дисциплины, соответственно, склонность к "технократическому" подходу и описанию | Гуманитарные дисциплины, соответственно, склонность к гуманитарному подходу и описанию |
Частота употребления частей речи | Больше существительных и глаголов | Больше прилагательных, превосходных степеней, междометий, уменьшительных вариантов слов |
Существительные | Абстрактные | Конкретные |
Залог глаголов | Активный | Пассивный |
Суффиксы | Характерная тенденция к употреблению уменьшительных и ласкательных суффиксов | |
Обозначение цветов | Основные тона | Оттенки, специфические названия |
Отношение к объекту или событию | Преобладание утилитарности (полезность, абстрагирование от эмоций и контекста), агрессивная позиция | Преобладание личностного отношения (симпатия, удовольствие), пассивная позиция, уступчивость |
Описание маршрута | При описании опора на направление | При описании опора на ориентиры, приметы |
Вместо послесловия
В статье признаки речевых особенностей полов даются только для людей с, так называемой, "традиционной сексуальной ориентацией". Различия для людей с аномальным поведением (я не смог подыскать более мягкое определение, чтобы не задеть самолюбие "сексуальных меньшинств") здесь не рассматривались.
С этим можно долго спорить, но у мужчин и женщин различия в мышлении, и речи, соответственно, столь сильны, что по меткому выражению одного психолога "они напоминают два, генетически совместимых, различных биологических вида, вынужденных уживаться и договариваться между собой". Как следствие этого, можно привести и тот факт, что "мужчина лучше поймет мужчину", и наоборот, женщина - женщину.
На речь человека накладывает отпечаток не только его пол, но возраст, раса, национальность, место рождения, образование, профессия. Не только взломом шифров и построением математических основ компьютерных систем, которыми мы пользуемся, и по сей день, но и этими проблемами занимался Алан Тьюринг (1912-1954) - английский математик и криптоаналитик, один из основателей кибернетики наряду с Клодом Шенноном и Норбертом Винером. Как у многих гениев у него была трагическая судьба. Попав под ложное обвинение в гомосексуализме, он был арестован, и поставлен судом перед выбором: или тюрьма или лечение. От годового лечения его психика пошатнулась, почти до полного одиночества сузился его круг общения. Те, на кого он работал (британский "большой брат"), не спускали с него глаз: он слишком много умел, и знал для преступника и сумасшедшего. 8 июня 1954 года он синтезировал цианистый калий. Так что, не следует слишком увлекаться анализом текстов...
Игра Тьюринга
В Технологическом институте Джорджии (Georgian Institute of Technology) США Джошуа Берман (Joshua Berman) использовал принципы Тьюринга для ведения исследования по социологии виртуальных сообществ и разработки программного обеспечения. Игра, доступная по адресу "http://www.cc.gatech.edu/elc/turing" в "реальном времени" может приблизительно просчитать пол, возраст и многое другое. Там же есть и поддержка чата для любителей интеллектуальных развлечений, где лучше владеть английским в совершенстве, чтобы не зачислили в "пятилетние папуасы" :). Правда, для специалистов по математической лингвистке этот сайт имеет минимальную ценность.