Оригинальная статья

 

Мифы об убийстве и множественный регресс

Тед Гертцель

Университет Рутгерса, Камден, штат Нью-Джерси, 08102

Опубликовано в The Skeptical Inquirer, том 26, № 1, январь / февраль 2002 г., стр. 19–23.

Если вам нужна более длинная техническая версия этого документа в формате Word, щелкните здесь .

Верите ли вы, что каждый раз, когда заключенного казнят в Соединенных Штатах, предотвращается восемь будущих убийств? Считаете ли вы, что увеличение на 1% числа граждан, имеющих лицензию на ношение скрытого оружия, приводит к снижению количества убийств в штате на 3,3%? Считаете ли вы, что от 10 до 20% снижения преступности в 1990-х годах было вызвано увеличением абортов в 1970-х? Или что уровень убийств увеличился бы на 250% с 1974 года, если бы Соединенные Штаты не построили так много новых тюрем?

Если вы были введены в заблуждение каким-либо из этих исследований, вы, возможно, попались на пагубную форму мусорной науки: использование математических моделей без продемонстрированной прогностической способности делать политические выводы. Эти исследования внешне впечатляют. Написанные авторитетными социологами из престижных институтов, они часто публикуются в рецензируемых научных журналах. Наполненные сложными статистическими расчетами, они дают точные числовые «факты», которые можно использовать в качестве аргументов спорщиков в политических аргументах. Но это «фактами» не назовешь. Прежде чем высохнут чернила в одном исследовании, появляется другое с совершенно другими «фактами». Несмотря на свой научный вид, эти модели не соответствуют основному критерию полезной математической модели: способности делать прогнозы лучше, чем случайные.

Хотя экономисты являются ведущими практиками этого загадочного искусства, у социологов, криминологов и других социологов также также есть его версии. Оно известно под различными названиями, включая «эконометрическое моделирование», «моделирование структурным уравнением» и «анализ пути». Все это способы использования корреляций между переменными для создания причинных выводов. Проблема с этим, как известно любому, кто прошёл курс статистики, состоит в том, что корреляция не является причинно-следственной связью. Корреляции между двумя переменными часто бывают «ложными», потому что они вызваны какой-то третьей переменной. Разработчики эконометрических моделей пытаются решить эту проблему, включая в свой анализ все соответствующие переменные, используя статистический метод, называемый «множественной регрессией».Если бы у кого-то были точные измерения всех причинных переменных, это сработало бы. Но данных никогда не бывает достаточно. Неоднократные попытки использовать множественную регрессию для получения окончательных ответов на вопросы государственной политики потерпели неудачу.

Но многие социологи не хотят признавать неудачи. Они посвятили годы изучению и преподаванию регрессионного моделирования и продолжают использовать регрессию для создания причинных аргументов, которые не подтверждаются их данными. Я называю эти аргументы мифами о множественной регрессии и хотел бы использовать в качестве примеров четыре исследования уровня убийств.

Миф первый: больше оружия, меньше преступности.

Джон Лотт, экономист из Йельского университета, использовал эконометрическую модель, чтобы доказать, что «разрешение гражданам носить скрытое оружие сдерживает насильственные преступления, не увеличивая несчастных случаев». Проведённый Лотт анализ «должен издавать» законы, требующие от местных властей выдавать разрешение на скрытое оружие любому законопослушному гражданину, который подаёт на него такое разрешение. Лотт подсчитал, что каждый процент увеличения владения оружием среди населения приводит к снижению количества убийств на 3,3%. Лотт и его соавтор Дэвид Мастард разместили первую версию своего исследования в Интернете в 1997 году, и десятки тысяч людей скачали её. Это исследование было предметом политических форумов, газетных колонок и часто довольно сложных дебатов во всемирной паутине. В книге с запоминающимся названием «Больше оружия, меньше преступлений» Лотт насмехался над своими критиками, обвиняя их в том, что они ставят идеологию выше науки.

Работа Лотта – пример статистического превосходства. У него больше данных и более сложный анализ, чем у всех, кто изучает эту тему. Он требует, чтобы каждый, кто хочет оспорить его аргументы, погрузился в очень сложную статистическую дискуссию, основанную на вычислениях, настолько сложных, что они не могут быть выполнены на обычных настольных компьютерах. Он призывает всех, кто с ним не согласен, загрузить его набор данных и повторить свои расчеты, но большинство социологов не думают, что им стоит копировать исследования с использованием методов, которые неоднократно терпели неудачу. Большинство исследователей в области контроля над огнестрельным оружием просто отвергли утверждения Лотта и Мастарда и продолжили свою работу. Два уважаемых исследователя уголовного правосудия, Фрэнк Зимринг и Гордон Хокинс (1997), написали статью, в которой объясняют, что:»

Точно так же, как господа Лотт и Мастард могут, используя одну модель детерминант убийства, произвести статистические остатки, предполагающие, что законы «должны издавать» уменьшают количество убийств, мы ожидаем, что решительный эконометрист может произвести трактовку одних и тех же исторических периодов с помощью различных моделей и противоположные эффекты. Эконометрическое моделирование – палка о двух концах, поскольку позволяет статистическим выводам согреть сердца истинных верующих любого толка.»

Зимринг и Хокинс были правы. В течение года два решительных эконометриста, Дэн Блэк и Дэниел Нагин (1998) опубликовали исследование, показывающее, что если они немного изменили статистическую модель или применили её к различным сегментам данных, результаты Лотта и Мастарда исчезли. Блэк и Нагин обнаружили, что, когда Флорида была удалена из выборки, «не было заметного воздействия законов о праве ношения на количество убийств и изнасилований». Они пришли к выводу, что «вывод, основанный на модели Лотта и Мастарда, неуместен, и их результаты не могут быть ответственно использованы для формулирования государственной политики».

Джон Лотт, однако, оспорил их анализ и продолжал продвигать свой собственный. Лотт собирал данные по каждому округу Америки за каждый год с 1977 по 1992 год. Проблема в том, что округа Америки сильно различаются по размеру и социальным характеристикам. На несколько крупных округах, содержащих крупные города, приходится очень большой процент убийств в Соединенных Штатах. Как оказалось, ни в одном из этих очень крупных округов нет законов о запрете на выпуск оружия. Это означает, что массивный набор данных Лотта просто не подходил для его задачи. У него не было изменений в своей ключевой причинной переменной – «должен издавать» законы – в местах, где происходило большинство убийств.

Он не упоминал об этом ограничении ни в своей книге, ни в статьях. Когда я обнаружил отсутствие законов «об издании» в крупных городах при моем собственном исследовании его данных, я спросил его об этом. Он пожал плечами, сказав, что в своём анализе он «контролировал» размер популяции. Но введение статистического контроля в математический анализ не компенсировало того факта, что у него просто не было данных по крупным городам, где проблема убийств стояла наиболее остро.

Мне потребовалось некоторое время, чтобы найти эту проблему в его данных, поскольку я не был знаком с проблемой контроля над оружием. Но Зимринг и Хокинс сразу обратили на это внимание, потому что они знали, что законы «должны издавать» были введены в штатах, где была сильна Национальная стрелковая ассоциация, в основном на юге, западе и в сельских районах. В этих штатах уже было несколько ограничений на оружие. Они отметили, что эта законодательная история подрывает «нашу способность сравнивать тенденции в штатах, которые« должны выдать », с тенденциями в других штатах. Поскольку штаты, в которых было внесено изменение законодательства, отличаются по местоположению и конституции от штатов, которые этого не сделали, сравнения по категориям законодательства всегда будут рискуют спутать демографические и региональные влияния с поведенческим воздействием различных правовых режимов “. Зимринг и Хокинс далее отметили, что:

Лотт и Мастард, конечно, знают об этой проблеме. Их решение, стандартный эконометрический метод, состоит в том, чтобы построить статистическую модель, которая будет учитывать все различия между Айдахо и Нью-Йорком, которые влияют на уровень убийств и преступности, за исключением законов о «издании». Если можно «указать» основные факторы, влияющие на убийства, изнасилования, кражи со взломом и угоны автомобилей в нашей модели, то мы сможем исключить влияние этих факторов на различные тенденции. Лотт и Мастард создают модели, которые оценивают влияние демографических данных, экономических данных и уголовного наказания на различные правонарушения. Эти модели являются окончательными в статистике домашней кухни, поскольку они созданы для этих данных, установленных этими авторами, и проверены только на данных, которые будут использоваться для оценки воздействия права на ношение.

Лотт и Мастард сравнивали тенденции в Айдахо, Западной Вирджинии и Миссисипи с тенденциями в Вашингтоне, округ Колумбия, и Нью-Йорке. На самом деле произошёл всплеск убийств, связанных с крэком, в крупных восточных городах в 1980-х и начале 1990-х годов. Вся аргументация Лотта сводилась к утверждению, что в основном сельские и западные штаты, «которые должны выдавать», были избавлены от эпидемии убийств, связанных с крэком, благодаря своим законам «должны выдавать». К этому никогда бы не подошли всерьёз, если бы это не было скрыто за лабиринтом уравнений.

Миф второй: заключение в тюрьму большего количества людей снижает преступность

Дело Лотта и Мастарда было исключительным только в том смысле, что оно привлекло внимание общественности. Довольно часто, даже типично, когда конкурирующие исследования публикуются с использованием эконометрических методов, чтобы прийти к противоположным выводам по одному и тому же вопросу. Часто в любом из анализов нет ничего явно неправильного. Они просто используют немного разные наборы данных или разные методы для достижения разных результатов. Кажется, что разработчики регрессионного моделирования могут достичь любого желаемого результата, никоим образом не нарушая правил регрессионного анализа. В одном исключительно откровенном заявлении о разочаровании таким положением дел два уважаемых криминолога, Томас Марвелл и Карлайл Муди (1997: 221), сообщили о результатах проведённого ими исследования влияния заключения на уровень убийств. Они сообщили, что они:

широко распространяли [свои] результаты вместе с использованными данными среди коллег, специализирующихся на количественном анализе. Самый частый ответ – они отказываются верить результатам, независимо от того, насколько хорош статистический анализ. За этим утверждением стоит часто обсуждаемое неформально, но редко публикуемое мнение, что социологи могут получить любой желаемый результат, манипулируя применяемыми процедурами. Фактически, широкий спектр оценок воздействия тюремных контингентов рассматривается как хорошее свидетельство гибкости исследований. Вывод, даже среди многих, кто регулярно публикует количественные исследования, заключается в том, что независимо от того, насколько тщательный анализ, результаты не заслуживают доверия, если они не соответствуют предыдущим ожиданиям. В таких рамках исследовательская дисциплина не может добиться успеха.

К их огромным достоинствам Марвелл и Муди откровенно признали проблемы множественной регрессии и внесли несколько предложений по улучшению. К сожалению, некоторые эконометристы настолько погружаются в свои модели, что теряют понимание того, насколько они произвольны. Они приходят к выводу, что их модели более реальны, более достоверны, чем беспорядочная, непокорная, «неконтролируемая» реальность, которую они пытаются объяснить.

Миф третий: казнь снижает преступность

В 1975 году журнал American Economic Review опубликовал статью ведущего экономиста Исаака Эрлиха из Мичиганского университета, который подсчитал, что каждая казнь предотвращает восемь убийств. До Эрлиха самым известным специалистом по эффективности смертной казни был Торстен Селлен, который использовал гораздо более простой метод анализа. Селлен подготовил графики, сравнивающие тенденции в разных штатах. Он не нашёл разницы между штатами со смертной казнью или без неё, поэтому пришёл к выводу, что смертная казнь не имеет значения. Эрлих, демонстрируя превосходство в статистике, заявил, что его анализ был более достоверным, поскольку он учитывал все факторы, влияющие на уровень убийств.

Еще до публикации работа Эрлиха была процитирована генеральным солиситором Соединенных Штатов в записке amicus curiae, поданной в Верховный суд Соединенных Штатов в защиту смертной казни. К счастью, Суд решил не полагаться на показания Эрлиха, поскольку они не были подтверждены другими исследователями. Это было мудро, потому что в течение года или двух другие исследователи опубликовали столь же сложные эконометрические анализы, показывающие, что смертная казнь не имела сдерживающего эффекта.

Разногласия по поводу работы Эрлиха были настолько важны, что Национальный исследовательский совет созвал группу экспертов с голубой лентой, чтобы рассмотреть ее. После очень тщательного анализа группа решила, что проблема не только в модели Эрлиха, но и в идее использования эконометрических методов для разрешения споров по поводу политики уголовного правосудия. Они (Manski, 1978: 422) пришли к выводу, что:

Поскольку данные, которые, вероятно, будут доступны для такого анализа, имеют ограничения, и поскольку преступное поведение может быть настолько сложным, не следует ожидать появления окончательного поведенческого исследования, которое положит конец спорам о поведенческих эффектах политики сдерживания.

Большинство экспертов теперь считают, что Селлен был прав, что смертная казнь не оказывает очевидного влияния на количество убийств. Но Эрлиха не убедили. Теперь он одинокий, искренне верящий в справедливость своей модели. В недавнем интервью (Боннер и Фессендрен, 2000) он настаивал, что «если учитывать такие вариации, как безработица, неравенство доходов, вероятность задержания и готовность применять смертную казнь, смертная казнь проявляет значительный сдерживающий эффект».

Миф четвертый: легализованные аборты привели к снижению преступности в 1990-е годы.

В 1999 году Джон Донохью и Стивен Левитт опубликовали исследование с новым объяснением резкого снижения количества убийств в 1990-х годах. Они утверждали, что легализация абортов Верховным судом США в 1973 году привела к сокращению рождаемости нежеланных детей, непропорционально большое количество которых превратилось бы в преступников. Проблема с этим аргументом состоит в том, что легализация абортов была разовым историческим событием, а разовые события не предоставляют достаточно данных для достоверного регрессионного анализа. Это правда, что в одних штатах аборты были легализованы раньше, чем в других, и Донохью и Левитт используют этот факт. Но все эти государства переживали одни и те же исторические процессы, и многое другое происходило в тот же исторический период, который повлиял на уровень убийств. Правильный регрессионный анализ должен учесть все эти вещи и проверить их в широком диапазоне вариаций. Существующие данные не позволяют выполнить это, поэтому результаты регрессионного анализа будут варьироваться в зависимости от того, какие данные выбраны для анализа.

В этом случае Донохью и Левитт предпочли сосредоточиться на изменениях за двенадцать лет, игнорируя колебания в течение этих лет. Поступая таким образом, как отмечал Джеймс Фокс (2000: 303), «они упустили большую часть изменений преступности в этот период – восходящую тенденцию в эпоху крэка конца 1980-х годов и нисходящую коррекцию в годы пост-крэка, что-то вроде изучения влияния лунных фаз на океанские приливы, но запись данных только для периодов отлива ».

Когда я писал эту статью, я включил предложение, гласящее, что «скоро другой аналитик регрессии, вероятно, повторно проанализирует те же данные и придёт к другим выводам». Несколько дней спустя моя жена передала мне газетный рассказ о таком исследовании. Автором книги был не кто иной, как Джон Лотт из Йельского университета и Джон Уитли из Университета Аделаиды. Они собрали те же цифры и пришли к выводу, что «легализация абортов повысила уровень убийств примерно на 0,5–7 процентов» (Lott and Whitely, 2001).

Почему такие заметно разные результаты? Каждый набор авторов просто выбрал свой способ моделирования неадекватного массива данных. Эконометрика не может сделать действующий общий закон из того исторического факта, что аборты были легализованы в 1970-х годах, а преступность снизилась в 1990-х. Для достоверного статистического теста нам понадобится как минимум несколько десятков таких исторических опытов.

Выводы.

Кислотным тестом в статистическом моделировании является предсказание. Прогноз не обязательно должен быть идеальным. Если модель может предсказывать значительно лучше, чем случайное предположение, это полезно. Например, если бы модель могла предсказывать цены на акции даже немного лучше, чем случайное предположение, это сделало бы её владельцев очень богатыми. Поэтому много усилий было потрачено на тестирование и оценку моделей цен на акции. К сожалению, исследователи, использующие эконометрические методы для оценки социальной политики, очень редко подвергают свои модели прогностическим тестам. Их оправдание состоит в том, что результаты становятся известны слишком долго. Вы не получаете новые данные о бедности, абортах или убийствах каждые несколько минут, как о курсах акций. Но исследователи могут проводить прогностическое тестирование и другими способами. Они могут разработать модель, используя данные из одной юрисдикции или периода времени, а затем использовать её для прогнозирования данных из других времён или мест. Но большинство исследователей просто не делают этого, а если и делают, то модели терпят неудачу, а результаты никогда не публикуются.

Журналы, публикующие эконометрические исследования вопросов государственной политики, часто не требуют прогностического тестирования, что показывает, что редакторы и рецензенты не возлагают большие надежды на свои области. Таким образом, исследователи берут данные за фиксированный период времени и продолжают точную настройку и корректировку своей модели до тех пор, пока не смогут «объяснить» тенденции, которые уже произошли. Всегда есть несколько способов сделать это, и с современными компьютерами не так уж и сложно продолжать попытки, пока не найдете что-то подходящее. На этом этапе исследователь останавливается, записывает результаты и отправляет статью для публикации. Позже другой исследователь может скорректировать модель, чтобы получить другой результат. Этим заполняются страницы научных журналов, и все делают вид, что не замечают, что прогресса нет. Но сегодня мы не ближе к действующей эконометрической модели уровней убийств, чем были, когда Исаак Эрлих опубликовал первую модель в 1975 году.

У научного сообщества нет хороших процедур для признания несостоятельности широко используемого метода исследования. Методы, закреплённые в программах магистратуры ведущих университетов и опубликованные в престижных журналах, как правило, сохраняются. Многие неспециалисты считают, что если исследование было опубликовано в рецензируемом журнале, то оно действительно. Рассмотренные нами случаи показывают, что это не всегда так. Рецензирование гарантирует соблюдение установленной практики, но мало помогает, когда сами эти практики ошибочны.

В 1991 году Дэвид Фридман, выдающийся социолог из Калифорнийского университета в Беркли и автор учебников по количественным методам исследования, пошатнул основы регрессионного моделирования, когда он откровенно заявил: «Я не думаю, что регрессия может нести большую часть бремени в причинный аргумент. Уравнения регрессии сами по себе не очень помогают в контроле смешивающих переменных »(Freedman, 1991: 292). Статья Фридмана вызвала ряд бурных откликов. Ричард Берк (1991: 315) заметил, что аргумент Фридмана «будет очень трудно принять большинству социологов, занимающихся количественными исследованиями. Он затрагивает самую суть их эмпирической деятельности и тем самым ставит под угрозу всю профессиональную карьеру».

Столкнувшись с критиками, которым нужны доказательства того, что они могут предсказывать тенденции, разработчики регрессионных моделей часто прибегают к статистическому превосходству. Они делают аргументы настолько сложными, что только высококвалифицированные аналитики регрессии могут их понять, не говоря уже о том, чтобы их опровергнуть. Часто этот прием срабатывает. Потенциальные критики просто сдаются в отчаянии. Дэвид Болдт из Philadelphia Inquirer (1999), после того как услышал доклад Джона Лотта о скрытом оружии и уровне убийств, а также сверился с другими экспертами, посетовал, что «попытка разобраться в научных аргументах – это почти глупое занятие. -статистика, фиктивные переменные и методы анализа данных «Пуассона» и «наименьших квадратов» ».

Болдт был прав, подозревая, что его заманивают на дурацкую миссию. На самом деле в социологии или криминологии нет важных открытий, которые нельзя было бы сообщить журналистам и политикам, не имеющим учёной степени в области эконометрики. Пора признать, что у императора нет одежды. При представлении эконометрической модели потребители должны настаивать на доказательствах того, что она может предсказывать тенденции в данных, отличных от данных, использованных для их создания . Модели, не прошедшие этот тест, являются мусорной наукой, независимо от того, насколько сложен анализ.

ССЫЛКИ

Берк, Ричард А. 1991. К методологии для простых смертных, “Социологическая методология”. 21: 315-324.

Болдт, Дэвид. 1999. « Изучение свидетельств об огнестрельном оружии », Philadelphia Inquirer, 14 декабря. Загружено 17 мая 2000 г. с: http://www.phillynews.com/inquirer/99/Dec/14/opinion/BOLDT14.htm.

Черный, Дэн. и Дэниел Нагин 1998. Сдерживают ли законы о праве ношения насильственных преступлений? Журнал юридических исследований 27: 209-219.

Боннер, Раймонд и Форд Фессендрен. 2000. В штатах, где не существует смертной казни, наблюдается более низкий уровень убийств », New York Times, 22 сентября. Загружено с: http://www.nytimes.com/2000/09/22/national/22DEAT.html .

Донохью, Джон и Стивен Левитт. 1999. Легализованные аборты и преступность. Юридический факультет Стэнфордского университета. Загружено в августе 2000 г. с: http://papers.ssrn.com/paper.taf?ABSTRACT_ID=174508 .

Фокс, Джеймс. 2000. Демография и убийства в США, В А. Блюмштейн и Дж. Уоллман (ред.), Снижение преступности в Америке , Cambridge University Press, Нью-Йорк, стр. 288–317.

Фридман, Дэвид 1991. Статистические модели и кожа обуви. Социологическая методология 21: 291-313.

Лотт, Джон. 2000. Больше оружия, меньше преступности: понимание законов о преступности и контроле над оружием . University of Chicago Press, второе издание с дополнительным анализом.

Лотт, Джон. и Джон Уитли. 2001. Аборты и преступность: нежеланные дети и внебрачные роды, Йельский исследовательский документ по праву и экономике № 254. Загружен 9 июля 2001 г. с: http://papers.ssrn.com/sol3/papers.cfm ? abstract_id = 270126 .

Марвелл, Томас и Карлайл Муди, C. 1997. Влияние роста числа тюрем на убийства. Исследования убийств 1: 205-233.

Зимринг, Фрэнк и Гордон Хокинс. 1997. Скрытые пистолеты: средство устрашения от подделок, The Responsive Community. 7: 46-60.

 

Гэта беларускі перавод * старонкі

www.cs.purdue.edu/homes/comer/essay.phd.html

Автора

Дугласа Э. Комера

Заслужанага прафесара кампутарных навук

аўтара, выкладчыка і кансультанта

Кафедра камп’ютэрных навук

Университет Пердью

Арыгінальная артыкул

Заметкі ступені доктара філасофіі

Праф. Дуглас Э. Комер

У мінулай нядзелі ў час кафэгіўнага часу калегія некалькі студэнтаў вучняў выкладчыкаў у дыскусіі аб нашай праграме доктарскай ступені. Стала ясна, што многія студэнты не разумеюць асноўных; яны былі выкарыстаны некаторымі пытаннямі і збіткамі з некаторымі адветамі.

Гэтыя прыклады ўтрымліваюць асноўную інфармацыю пра цэлыя праграмы доктара філасофіі ў спробе дапамагчы студэнтам вырашыць, а затым працягваць навучанне на сцэнары ў дактарантуры.

Асновы

Степень доктара філасофіі, скарочана кандыдат навук, з’яўляецца вышэйшай акадэмічнай стэпеню, якая можа атрымліваць кожны. Пасля таго, як получение ступені доктара філасофіі патрабуе працяглага навучання і інтэнсіўных інтэлектуальных сіл, менш аднаго адсотка насельніцтва атрымлівае ступень. Агульнасць дэманструе павагу да чалавека, якая мае доктарскую стэпень. звярнуцца да яго з тытулам “Доктар”.

Каб атрымаць доктарскую ступень, трэба выканаць дзве задачы. Во-первых, трэба цалкам ахарактарызаваць канкрэтны прадмет. Ва-ўторых, трэба расшырыць сукупнасць знанняў па гэтым прадмеце.

Освоение прадмета

Каб азнаёміцца ​​з прадметам, студэнт праглядае апублікаваную літаратуру, каб знайсці і прачытаць усё, што было напісана па гэтым прадмеце. Ізучаючыя навуковыя дысцыпліны, студэнт пачынае вывучаць астатнія даведачныя матэрыялы, такія як вучні. У канцэрцы студэнт таксама павінен шукаць у навуковых часопісах, публікацыях, якія выкарыстоўваюць для азнаямлення з інфармацыяй і запісамі ад навуковых даследаванняў.

Кажывы ўніверсітэт устанаўлівае правілы агульнага карыстання, якім трэба падпісацца на студэнтаў, каб атрымаць доктарскую ступень і кожны каледж альбо факультэт ва ўніверсітэце ўстанаўлівае вызначаныя стандарты, дзякуючы якім ён змяняе ўзровень уласных прадметаў. Як правіла, падрыхтоўка да кандыдата навук, праца ў пэўнай вобласці, студэнт павінен атрымаць як ступень бакалаўра, так і ступень магістратуры (альбо іх эквівалент) у гэтай галіне альбо ў асобна звязанай вобласці. Каб прадэманстраваць поўнае кіраванне прадметам, студэнт можа запатрабаваць прайсці дадатковыя курсы для аспірантаў, падтрымаць высокі сярэдні бал альбо змяніць шэраг спецыяльных экзаменаў. Шмат якія навучальныя студэнты павінны выконваць усе тры задачы.

Па заканчэнні экзамены на паўтара ступені доктара філасофіі дастаткова сложных, каб навучальныя праграмы ацэньвалі экспертныя знанні, яны ствараюцца і ацэньваюцца камітэтам экспертаў, кожны з якіх мае доктарскую ступень.

Расширение знаний

Суць доктара філасофіі, гэта аспект, які адрознівае даследаванне доктара філасофіі ад іншых навуковых работ, можна рэзюміраваць адным словам: даследаванне. Каб расшырыць знанне, трэба даследаваць, вывучаць і размышляць. Навуковае паведамленне выкарыстоўвае тэрмін « даследаванне», каб выказаць ідэю.

У навуковых дысцыплінах даследавання часта разумеецца эксперыментаванне, але даследаванне – гэта больш, чым проста эксперыменты, гэта азначае інтэрпрэтацыю і глыбокае разуменне. Для кампутарных навуковых даследаванняў патрэбны пошук прынцыпаў, якія ляжаць у аснове лічбавых вылічэнняў і камунікацый. Даследчык павінен адкрыць новыя метады, якія дапамагаюць ствараць альбо выкарыстоўваць вычышчальныя механізмы. Даследчыкі шукаюць новыя абстракцыі, новыя падходы, новыя алгарытмы, новыя прынцыпы альбо новыя механізмы.

Каб атрымаць доктарскую ступень, кожны студэнт павінен прадставіць выкладчыкам вынікі сваіх даследаванняў у выглядзе доўгага афіцыйнага дакумента, называючы дысертацыю (больш шырокае імя дысертацыі). Затым студэнт павінен прадставіць дысертацыю на факультэце і абараніць сваю працу на агульным узроўні.

Аднашэнне да прадукту

У некаторых выпадках вынікі навуковых даследаванняў могуць быць выкарыстаны для распрацоўкі новых прадуктаў або паляпшэння існуючых. Аднак вучоныя не выкарыстоўваюць камерцыйны поспех альбо патэнцыяльную камерцыйную прыбытак у якасці меры сваёй працы; яны праводзяць даследаванні для далейшага чалавечага разумення і сукупнасці знанняў, сабраных людзей. Часта камерцыйныя выгады ад навуковых даследаванняў у доўгатэрміновай перспектыве намнага больш, чым у кароткачасовай.

Исследовательская деятельность

Даследаванні ў галіне камп’ютэрных навук могуць уключыць у сябе розныя разнастайныя віды дзейнасці, як праектаванне і стварэнне новых камп’ютэрных сістэм, доказ матэматычных тэарэмаў, напісанне камп’ютэрнага праграмнага забеспячэння, вызначэнне прадукцыйнасці камп’ютэрнай сістэмы, выкарыстанне аналітычных інструментаў для ацэнкі праекта альбо вывучэнне памылак, дапушчальных праграм пры стварэнні вялікі праграмны комплекс. Пасля таго, як даследчык выбярэ дзеянні, якія падыходзяць для адказу на кожны пытанне, узнікаючы ў ходзе даследавання і ў ходзе расследавання, адказваюць на новыя пытанні, даследчая дзейнасць вар’іруецца ад праекта па праекце і цягам часу ў рамках аднаго праекта. Даследчык павінен быць гатовы выкарыстоўваць мноства падходаў і інструментаў.

Нясколькі пытанняў, якія трэба задаць

Многія з вас спрабуюць вырашыць, варта абараніць ступень на доктарскую дысертацыю. Вот некалькі пытанняў, якія вы можаце задаць сабе.

1. Вы хочаце навучную кар’еру?

Перад паступленнем у доктарантуру праграм, вы будзеце абавязкова абмяркоўваць свае доўгатэрміновыя цэлы. Пасля таго, як получение ступені доктара філасофіі гэта падрыхтоўка да даследавання, вы павінны паспрабаваць сябе, з’яўляецца даследаваннем даўгоў вашай доўгатэрміновай мэты. Калі гэта так, ступень доктара філасофіі з’яўляецца стандартным шляхам да выбраннай вамі кар’еры (некалькім людзям удалося атрымаць даследчую дольнасць без доктарскай ступені, але яны з’яўляюцца выключэннем, а не па правілах). Калі, аднак, вы хочаце кар’еру, не звязаную з даследаваннямі, кандыдат навук вызначаны не для вас.

2. Вы хочаце акадэмічную даўжнасць?

Доктар філасофіі дэ-факта “прафсаюзны білет” на акадэмічную даўжнасць. Хоць магчыма атрымаць акадэмічную дольнасць без доктара філасофіі, аднак шансы невялікія. Крупныя універсітэты (і большасць каледжаў) патрабуюць, каб кожны выкладчык імеў стэпень доктара філасофіі. і займацца даследчай дзейнасцю. Почему? Абавязковасць наяўнасці ў факультэце дастатковага досведу для выкладання прадоўжаных курсаў і пакіданне выкладчыкаў застаюцца актуальнымі ў абранай імі вобласці. У дыпламатычным пратаколе Дзярждэпартамента ЗША тытул “прафесар” стаіць вышэй, чым тытул “доктар”. Гэта робіцца з вучнямі акадэмічных патрабаванняў: большасць прафесараў маюць доктарскую ступень, але не ўсе людзі, якія маюць доктарскую ступень, валодаюць ступенямі прафесара.

3. У вас ёсць тое, што трэба?

Чалавеку сложна ацэньваць уласныя магчымасці. Наступныя рэкамендацыі і пытанні могуць апынуцца полезнымі.

Інтэлект:

У каледжы і ў аспірантуры вы наблізіліся да лепшых альбо апошніх класаў? Наколькі добра вы справіліся з GRE альбо іншымі стандартнымі тэстамі?

Час:

Гатовы лі вы ўзяць для праекта больш буйны, чым любы з іх, што вы прадпрымалі раньшэ? Вы павінны перажыць некалькі гадоў напярэдадні працы. Ці трэба скараціць альбо паказаць іншыя заняткі?

Крэатыўнасць:

Навуковыя адкрыцці часта вознікаюць, калі хто-небудзь па-новаму глядзіць на старыя факты. Сіяеш пры вырашэнні праблемы? Вам нравяцца галаваломкі і падобныя ім нестандартныя рашэнні? У вас добра атрымліваеш іх прачытаць? У школе вы знаходзіце высшую матэматыку прыемнай альбо сложнай?

Сільнае любопытства:

Вы заўсёды былі вынуджаныя разумець навакольны свет і выяўляць, як усе ўстроена? Эстэственнае любопытства аблягчае даследаванні. Вы выконвалі мінімальныя патрабаванні альбо адказвалі на пытанне далей самастойна?

Адаптыўнасць:

Большасць студэнтаў не гатовыя да паўторнага доктарскага ўзроўню з дапамогай пастаяннага навучання. Для іх гэта неажыданнае адлічэнне ад курсавой працы. Унезапна апынуўся ў свеце, у якім ніхто не ведае адказаў, студэнты інакш запісваюцца. Вы можаце адаптавацца да новага ўтварэння мышлення? Ці можаце вы вытрымаць пастаянны пошук адказаў, нават калі ніхто не ведае тых пытанняў?

Самаматывацыя:

Да таго часу, калі студэнт заканчвае навучанне ў бакалаўраце, ён атрымлівае ацэнку за кожны курс кожнага семестра. Кто мае стэпен доктара філасофіі, у сваёй праграме яны не працуюць на асобных курсах, выкладчыкі не раздзяляюць задачы на ​​невялікія заданні і студэнт не атрымлівае ацэнку за кожны маленькі шаг. Дадатак ці вы матываваны, каб працягваць працаваць над дасягненнем цэлых без штодзённай падтрымкі?

Канкурэнтаздольнасць:

Калі вы накіруеце праграму ў доктарантуру, вы будзеце сарвацца з іншымі, хто ўжо наверху. Што яшчэ больш важна, калі вы закончыце вучыцца, сярод вашых супернікаў будуць адны ад самых яркіх людзей у свеце. Вас будуць ацэньваць па параўнанні з імі. Готовы ли вы стать кандидатом наук? узровень?

Срок пагаднення:

Па параўнанні з курсавой працай, якая ў цэлым плануе навучанне, даследаванне доктара філасофскіх навук мае меншую структуру. Калі вы будзеце атрымліваць большую свабоду ў стварэнні ўласных цэлаў, вызначэнне штодзённай графікі і рэалізацыя цікавых ідэй. Гатовы лі вы прыняць на сябе адказнасць за дадатковыя свабоды? Ваш поспех альбо няўдача ў даследаваннях у дактарантуры залежаць ад гэтага.

Нясколка папярэджаны:

Студэнты інагда прыступаюць да праграмы ў дактарантуры па няправільнай прычыне. На працягу некаторага часу такія навучэнцы выяўляюць, што патрабаванні іх даюць. Перад тым, як пачаць, трэба зразумець, што доктарская ступень не з’яўляецца:

Прэстыжн ой сам а па сабе

Практычна кожны, хто атрымаў доктарскую сценку. гордзіцца сваімі намаганнямі і вынікамі. Аднак вы павінны разумець, што пасля атрымання дыплома вы будзеце працаваць у групах навучэнцаў, кожны з якіх мае доктарскую ступень. (Адзін выкладчык атрымаў звычайнае распаўсюджванне высокамадэрных аспірантаў, кажучы: “Я не разумею, чаму вы думаеце, што гэта такое вялікае дасягненне – ва ўсіх маіх друзей ёсць доктарскія ступені!”).

Гарантыя паважання да ўсяго твайму меркаванню

Многія студэнты лічаць, што, атрымаўшы доктарскую ступень, людзі аўтаматычна будуць паважаць усе іх меркаванні. Аднак хутка вы даведаецеся, што мала хто з тых, хто атрымлівае доктарскую ступень у адным прадмеце, аўтаматычна становіцца аўтарытэтам іншых. Гэта асабліва верна адносна навуковага паведамлення: уважлівасць трэба заслужыць.

Цель сама па сабе

Степень доктара філасофіі гатовы вас да даследаванняў. Калі вам патрэбны толькі дыплом, які можна павялічыць на сцяне, можна атрымаць больш простыя спосабы яго атрымання. Пасля выхаду ў вас будзе магчымасць параўноўваць свае дасягненні з вынікамі іншых вучонага. Вы паймайце, што важна даследаваць працу, назапашаную пасля таго, як навучальны закон чыніць сваё фармальнае адукацыю.

Гарантия работы

Калі эканоміка замяшчаецца, кожны можа пастрадаць. Фактычна, некаторыя кампаніі скарачаюць даследаванні да таго, як скарачаюць вытворчасць, што робіць кандыдатаў навукоўцаў асабліва ўяўнымі. Больш за тое, як толькі чалавек атрымлівае доктарскую ступень, многія кампаніі не прымаюць яго на працу, не звязаную з даследаваннямі. Як і ў большасці прафесіяналаў, працяг працы залежыць ад працягваецца працы.

Практычны здольнасць вырабляць уражанне на сваю сям’ю ці сяброў

Ваша маці можа быць гордай і ўзважана, калі вы ўступіце ў праграму доктарскай ступені. Ведзь яна воображает, што хутка сможет похвастаться своим ребенком, “доктором”. Аднак жаданне вырабляе ўражанне на навакольных – недастатковая матывацыя для патрэбных сіл.

Што-тое, што вы можаце  папрабоўваць”, каб даведацца, наколькі вы думаеце

Извините, но гэта не так. Калі вы не зробіце ўсё магчымае, вы патэрпеце няўдачу. Вам трэба будзе працаваць шмат гадзін, звяртаючыся да шматлікіх расчараванняў, расшыраць свае разумныя здольнасці і навучыцца знаходзіць парадак сярод відавочных хаатычных фактаў. Калі вы не паставілі перад сабой доўгатэрміновую мэту артыкула даследчыка, неабходныя ўмовы ўмяшання вас. Стандарты будуць казацца ненужнымі высокімі; строгасць паказваецца неабасаванай. Калі вы посчитаете гэта выпрабаванне, вы ў канцэрце даведаецеся.

Адзіная даследчая тэма, якой вы калі-небудзь будзеце займацца

Многія студэнты здзяйсняюць памылкі, праглядаючы свае доктарскія дысертацыі. тэма як вобласць даследаванняў на ўсю жыццё. Яны мяркуюць, што кожны даследчык працуе толькі ў адной вобласці, заўсёды шукае адну і тую тэму ў гэтай вобласці і заўсёды выкарыстоўвае адны і гэтыя інструменты і падходы. Дасведчаныя даследчыкі ведаюць, што новыя пытанні ўзнікаюць пастаянна, і старыя пытанні могуць стаць менш цікавымі з цягам часу альбо адкрыцьцё новых фактараў. Лепшыя людзі мяняюць тэмы і вобласці. Гэта захоўвае іх свежасць і стымулюе мышленне. Планіруйце рухацца далей; подготовиться к переменам.

Легча, чым папасці ў рабочую сілу

Вы выявіце, што шлях да паспяховага завяршэння доктарскай ступені застаецца намнага круча пасля пачатку. Падрыхтоўшчыкі складаюць абмежаванні на ваша навучанне і не выпрацоўваюць непрадуктыўныя студэнты застаюцца на праграме.

Лучшэ, чым іншыя альтэрнатывы

Для многіх студэнтаў доктарская ступень можа быць праклятыя. Яны павінны выбіраць паміж часам, каб быць на вершыні сярод людзей, якія маюць стэп магістрату, альбо быць пасрэдным даследчыкам. Падрыхтоўшчыкі знешнепалітычных саветаў выбіраюць паміж тэмамі, каб быць “капітанам каманд B” альбо “доўгатэрміновым скамейкам запасных” у камандзе А. Калі трэба вырашыць, чаго ён хоча, і какая прафесія будзе больш чым стымуляваць. Цяпер трэба рэальна ацэньваць свае магчымасці. Калі вы сапраўды не можаце вызначыць сваю пазіцыю, паспрабуйце выкладчыкаў.

Способ зарабіць больш грошай

Хоць мы не слышали ніякай статыстыкі за апошнія пару гадоў, апіранты звычайна ацэньвалі “аддачу”, выкарыстоўваючы пачатковую зарплату доктара філасофіі і паўнамоцтвы МС, за час, неабходны для атрымання доктарскай ступені, кошту апцыёнаў на акцыі і бягучай даходнасці інвестыцый. Наколькі нам вядома, на працягу як мінімум пяці гадоў аддача была яўна адмоўлена. Дастаткова сказаць, што трэба выбіраць даследаванні, таму што яны нравяцца; доктар філасофіі не лепшы шлях да багацця.

Харошыя навіны:

Несмотря на все наши предупреждения, мы гордимся тем, што атрымалі доктарскую сцену. ступені і гордзімся сваімі даследчыцкімі дасягненнямі. Калі ў вас ёсць магчымасці і інтарэсы, навуковая кар’ера можа прынесці ўзнагароды, не называючы сябе раўнымі ў любой іншай прафесіі. Вы сустракаецеся і працуеце з некаторымі з самых яркіх людзей на планеце. Вы дасягнулі ідэі, якая вам не даступная, і тым самым расшырыце свае інтэлектуальныя магчымасці. Вы выправіце праблемы, якія не вырашалі ранне. Вы даведаецеся канцэпцыі, якія яшчэ не былі вывучаны. Вы адкрываеце для сябе прынцыпы, якія мяне выкарыстоўваюць, як людзі выкарыстоўваюць кампутары.

Радасць даследаванняў:

Калега рэзюміравала стаўленне многіх даследчыкаў да сваёй прафесіі. Калі яго спрабавалі, ён правёў так шмат гадзін у лабараторыях, адзначыў, што альтэрнатыўны шлях быў зроблены, калі ён мог рабіць тое самае, што і мільёны іншых, альбо рабатаваць у сваёй лабараторыі, дзе ён мог выявіць вешчы, якія іншага чалавека калі-небудзь не выявіў. Улыбка на яго асобе рассказвала ўсю гісторыю: для яго праца над даследаваннямі была чыстай радасцю.

Кратко об авторе Дуглас Э. Комер

Заслужаны прафесар кампутарных навук

Прафесійныя электратэхнікі і вычышчальнай тэхнікі (любасна прадастаўлена)

Паступіў у Дзяржаўны універсітэт пенсільваніі: восень 1976 г.

Образование

BS, Хоўтонскі каледж, матэматыка і фізіка (1971)

Доктар філасофіі, Дзяржаўны універсітэт Пенсільваніі, камп’ютэрныя навукі (1976)

Путь ученого

Прафесійны камер – усемарна прызнаны эксперт па камп’ютэрным сетаме і пратаколам TCP / IP. Ён працуе з TCP / IP і Інтэрнэтам з канца 1970-х гадоў. Камер зарабіў сабе рэпутацыю галоўнага даследчыка ў некалькіх ранніх даследчых праектах Інтэрнета. Ён быў старшынёй тэхнічнага камітэта CSNET, старшынёй Савета па архітэктуры распаўсюджаных сістэм DARPA і членам Савета па Інтэрнэт-дзейнасці (група даследчыкаў, пабудаваных у Інтэрнэце).

Камер стварыў курсы па камп’ютэрнай сетцы, Інтэрнэце, пратаколам TCP / IP і аперацыйным сістэмам для розных аўдыторый, уключаючы агульнадаступныя курсы для інжынераў і менш тэхнічныя курсы для іншых; ён працягвае прапаноўваць розныя адлюстраванні і сетавыя канферэнцыі па ўсім свеце. Акрамя таго, Comer кансультуе прыватны сектар па пытаннях праектавання сетэя і старога абсталявання.

Прафесар Комер вядомы сваёй серыяй наватарскіх вучняў па камп’ютэрных сецях, Інтэрнэце, камп’ютэрных аперацыйных сістэмах і камп’ютэрнай архітэктуры. Яго кнігі перакладаюцца на шаснаццаць моў і шырока выкарыстоўваюцца як у прамысловасці, так і ў акадэмічных кругах.

Трэцяя серыя Камера «Межсетевое ўзаемадзеянне з TCP / IP» часта цытуецца як аўтарытэтны даведнік па Інтэрнэт-пратаколам.

Што яшчэ больш важна, тэксты Камера выкарыстоўвалася ў пятніцу з шэсцьнадцаці вядучых аддзелаў камп’ютэрных навук, перагледжаных у рэйтынгах Навін ЗША і свету .

Даследаванне Камера носіць эксперыментальны характар.

Ён і яго навучэнцы праектуюць і рэалізуюць працоўныя прататыпы вялікіх сложных сістэм. Затым змяняюцца характарыстыкі атрыманых прататыпаў. Праграмнае забеспячэнне для аперацыйнай сістэмы і пратакола, створанае ў выніку даследавання Comer, выкарыстоўваецца прамысловасць у розных прадуктах.

На працягу двух гадоў прафесар Комер быў галоўным рэдактарам даследчага часопіса Software – Practice And Experience, выдаваемага John Wiley & Sons. З 2003 па 2009 год Камер апынуўся ў атэстаце з Purdue і працаваў у Cisco Systems, дзе займаўся даўгаватасцю першага віцэ-прэзідэнта Cisco па даследаваннях.

Камер з’яўляецца членам ACM і лауреатом павышэння кваліфікацыі педагагічных навук.

Избранные публикации

Д.Комер, «Дызайн аперацыйных сістэм – падыход Xinu, другое выданне», CRC Press, 2015 г.

Д.Комер, «Компьютерные сети и Интернет, шестое издание», Пранціш Хол, Верхняя рака Сядла, Нью-Джэрсі , 2014 г.

Д. Комер, «Межсетевое ўзаемадзеянне з TCP / IP, Том 1 – Прынцыпы, пратаколы і архітэктура», Prentice Hall , Upper Saddle River, NJ, 2013 г.

© 2020. Гэтая праца ліцэнзавана на ўмовах ліцэнзіі Creative Commons Attribution-ShareAlike 4.0

Оригинальная страница

 

Int. J. Человеко-машинные исследования (1983) 18, 199-214

 

Пользователи – это личности:

– индивидуализация моделей пользователей

 

ЭЛЕЙН РИЧ

 

Департамент компьютерных наук, Техасский университет в Остине, Остин, Техас 78712, США

(Поступила 13 мая 1981 г.)

 

Давно признано, что для создания хорошей системы, в которой человек и машина взаимодействуют при выполнении задачи, важно учитывать некоторые значимые характеристики людей. Эти характеристики

используются для построения некой «пользовательской модели».Традиционно построенная модель представляет собой модель канонической (или типичный) пользователь. Но часто отдельные пользователи так сильно различаются, что модели канонического пользователя недостаточно. Вместо, необходимы модели индивидуальных пользователей. В этой статье представлены несколько примеров ситуаций, в которых отдельные модели пользователей важны. Также представлены некоторые приёмы, позволяющие создавать и использовать такие модели возможными. Все эти методы отражают желание переложить большую часть бремени построения моделей на систему, а не на пользователя. Это приводит к разработке моделей, которые представляют собой набор хороших догадок о пользователе. Таким образом, необходимо какое-то вероятностное рассуждение.И, поскольку, модели используются для руководства лежащего в основе системы, они также должны отслеживаться и обновляться в соответствии с взаимодействиями между пользователем и

системой. Обсуждается производительность одной системы, в которой используются некоторые из этих методов.

1. Введение

Давно признано, что для создания хорошей системы, в которой человек и машина взаимодействуют, при выполнении задачи важно учитывать некоторые значимые характеристики людей. Затем система может быть предназначены для использования этих характеристик, а не для борьбы с ними.

Традиционно это делалось путём сбора данных об эффективности среднего человека при выполнении различных задач в различных средах. Например, закон Фиттса (Fitts & Peterson, 1964) гласит, что время, необходимое человеку, чтобы переместить объект в руке в определённую целевую позицию пропорционально log 2 (2A / w), где A – расстояние, на которое нужно переместить, а w – ширина цели. Этот результат показывает, как скорость, с которой человек может управлять машину можно увеличить, увеличив размер мишеней (таких как кнопки и переключатели), которые оператор должен ударить. В качестве ещё одного примера работы этого класса рассмотрим большой объем данных о взаимосвязи между размером букв и их читаемостью (Smith, 1979). Эти результаты важны при проектировании не только самых разнообразных машин, но также и других артефактов, таких как дорожные знаки.

Основная слабость этих исследований заключается в том, что они делают предположение, что вовлечённые люди составляют однородный набор. Согласно этому предположению, значения, которые определены для характеристики “типичного” человека, могут быть

использованы для разработки системы, которая будет использоваться всеми остальными. Хотя в большинстве случаев верно, что по крайней мере для большинства людей, система адаптирована к ним лучше, чем она была бы без этих исследований, неверно, что такая система, вероятно, будет лучшей из возможных. Намного лучше была бы система, в которой интерфейс

представленный каждому человеку был бы адаптирован к его собственным характеристикам, а не к характеристикам каких-то абстрактных “типичных” людей. Хотя обсуждение индивидуальных различий между пользователями редко в литературе встречается по человеческому фактору, они не совсем отсутствует. Например, Hudgens & Billingsley (1978) утверждают, что пол является важной переменной человеческого

факторы исследования. Другое исследование, проведённое Лоо (1978), обсуждает индивидуальные различия в восприятии дорожных знаков.

Одна из причин того, что такие исследования были редкостью, заключается в том, что они часто слишком дороги или невозможны по физическому обустройству – высокий уровень гибкости, который они предлагают. Однако по мере того, как мы начинаем видеть, что все больше и больше людей взаимодействия с машинами, опосредованные компьютерами под управлением программного обеспечения, становится возможным обеспечить гибкость, необходимая для действительно персонализированных систем.

В качестве простого примера снова рассмотрим вопрос размера букв и их разборчивости. Если это буквы дисплея

воспроизведённые с использованием стандартного светодиодного дисплея, то они будут одинакового размера для всех считывателей. Но предположим, что буквы отображается на ЭЛТ, управляемом компьютером. Теперь линии можно рисовать везде, где необходимо, чтобы получить широкие различные размеры букв по запросу отдельных пользователей.

В последнее время дизайнеры пользовательско – компьютерных интерфейсов начали обращать внимание на потребности определенных типов пользователей. Одна из часто обсуждаемых групп – это класс “случайных” пользователей, от которых нельзя ожидать, что они используют систему с большой регулярностью [см., например, Codd (1974) и Cuff (1980)]. Затем эта группа должна быть в отличие от менее изученных видов, обычных, опытных пользователей. К сожалению, немногие системы будут используется исключительно людьми одного класса. И похоже, что системные функции, облегчающие жизнь одному типу пользователь усложняет задачу для другого. Например, одно исследование эффективности пользователей – экспертов в задаче редактирования текста (Card, Moran & Newell, 1980) предполагает, что количество нажатий клавиш, необходимое для выполнения операция должна быть минимизирована. Ещё одно исследование людей, которые только учатся пользоваться редактором (Ledgard, Whiteside, Singer & Seymour, 1980) предлагает использовать полные слова на английском языке. Эти противоречивые требования указывают на необходимость в системе, которая может различаться для разных пользователей.

К счастью, компьютер предоставляет средства для повышения персонализации, так как он также даёт больше потребность в этом, увеличивая круг задач, для решения которых люди могут надеяться получить прибыль, имея дело с машинами. Задачи, которые

ранее выполнялись людьми, например, сбор желаемой информации из какой-то базы данных, теперь делаются компьютерами. Люди, которые выполняли эти задачи, смогли удовлетворить разнообразные потребности другие люди, с которыми они имели дело. Чтобы машины могли выполнять эти задачи и выполнять их удовлетворительно, они тоже будут должны быть способны приспособиться к индивидуальным потребностям. Для этого им придётся использовать модели отдельных пользователей, с которыми они сталкиваются. Это потребует расширения традиционного понятия «пользовательская модель».

В оставшейся части этой статьи мы исследуем проблему пользовательского моделирования конкретно в контексте компьютерного моделирования программных систем, как из-за все более широкого использования таких систем большими группами людей, так и из-за присущим таким системам гибкости, которая делает возможным эффективное моделирование.

2. Пространство пользовательских моделей

Термин «пользовательская модель» можно использовать для описания самых разных знаний о людях. Использование пользовательских моделей охватывают домен одинаковой ширины. Отношения между этими разнообразными структурами можно довольно легко увидеть, если Вселенная «пользовательских моделей» характеризуется как трёхмерное пространство. Размеры, каждого из которых будет рассматриваться ниже более подробно:

  1. одна модель одного канонического пользователя против набора моделей отдельных пользователей.
  2. модели, указанные явно либо разработчиком системы, либо самими пользователями, по сравнению с моделями, выведенными система на основе поведения пользователей.
  3. модели с довольно долгосрочными пользовательскими характеристиками, такими как области интересов или опыт, по сравнению с моделями относительно с краткосрочными характеристиками пользователя, такие как проблема, которую пользователь в настоящее время пытается решить.

Есть и другие существенные различия между системами, использующими эти различные типы пользовательских моделей, но они следуют из этих основных различий. Системы с единственной моделью канонического пользователя могут иметь эту модель, что постоянно встроена в самих себя, тогда как системы с моделями отдельных пользователей должны строить модель

“ на лету ”, и поэтому необходимо четко указать, каким образом модель влияет на производительность всей системы.

Системы, которые извлекают модель пользователя из поведения пользователя, должны серьёзно решать проблемы неправильной или противоречивой информации, вытекающей из выводов, которые привели к данной модели. Системы с явно указанным пользователем

информацией могут, с другой стороны, избежать многих из этих проблем. Системы, работающие с краткосрочными знаниями, должны успешно справляются с проблемой обнаружения, когда что-то меняется, в то время как более долгосрочные системы могут проявлять ловкость в этом вопросе. Но поскольку эти различия сводятся к трём, указанным выше, их не нужно сосредотачивать на явных мелких несоответствиях.

В следующих трёх разделах кратко обсуждается, как можно выбрать наилучшее положение в этом трехмерном пространстве.

 

2.1.КАНОНИЧЕСКИЕ МОДЕЛИ ПРОТИВ ИНДИВИДУАЛЬНЫХ МОДЕЛЕЙ

Этот параметр характеризует основное отличие “классической” работы с человеческим фактором от более гибкой модели, необходимые для предоставления индивидуализированных интерфейсов, которые позволяет программное управление. Разнообразие компьютерных систем были разработаны на основе канонической пользовательской модели. Например, ZOG (Робертсон, Ньюэлл и Рамакришна, 1981) – это

основанная на кадрах система, которая упрощает взаимодействие пользователя с компьютером. На его дизайн сильно повлияли такие факторы, такие как скорость отклика, необходимая для предотвращения разочарования пользователя. Еще один пример системы, построенной на модель канонического пользователя – это автоматизированный консультант Genesereth по MACSYMA, пакету символьной математики (Genesereth, 1978). Консультант использует явную модель стратегии решения проблем, используемую MACSYMA пользователями. Но, как было предложено выше, есть предел полезности этих канонических моделей для системы с гетерогенным сообществом пользователей. Отдельные модели могут позволить таким системам предоставить каждому пользователю более удобный интерфейс соответствующий его потребностям, чем можно было бы представить с помощью канонической модели. Конечно, необходимо продемонстрировать

что существуют методы для реализации таких моделей, чтобы они действительно улучшали производительность

системы. Разнообразие таких техник будет представлено в разделе 3.

Решение использовать отдельные пользовательские модели оказывает глубокое влияние на другие аспекты пользовательского моделирования. Если

система имеет только одну модель канонического пользователя, которую можно спроектировать один раз, а затем напрямую включены в общую структуру системы. Если, с другой стороны, система в конечном итоге должна обладать большим массивом моделей, соответствующих каждому из его пользователей, вопрос о том, как и кем эти модели должны быть построены возникает. Это приводит ко второму измерению в пространстве пользовательских моделей.

 

2.2. ЯВНЫЕ ПРОТИВ НЕЯВНЫХ МОДЕЛЕЙ

Есть два способа сделать системы разными для разных пользователей. Один из них – позволить пользователям модифицировать систему в соответствии под самих себя. Это подход, используемый многими системами, которые позволяют пользователям явно создавать свои собственные среды внутри системы.

Рассмотрим, например, компьютерную программу, которая позволяет пользователям системы общаться с каждым другим, отправляя почтовые сообщения туда и обратно. Программа хранит сообщения в наборе файлов и предоставляет функции, с помощью которых пользователи могут читать сообщения, отвечать на них и т. д. Такие системы часто позволяют пользователям устанавливать системные параметры, определяющие, например, какие поля сообщения будут отображаться при печати сообщения. А гораздо большая степень персонализации обеспечивается такими системами, как большинство реализаций программирования язык LISP, который позволяет пользователям указывать произвольно сложную программу, которая будет автоматически выполняться всякий раз, когда пользователь входит в систему. С помощью этого средства пользователь может создавать свои собственные процедуры, изменять системные переменные, или определить свои собственные символы. Такой же подход можно увидеть во многих системах «персонализированных баз данных» (Mittman &

Борман, 1975). В этих системах персонализация обусловлена ​​тем, что каждый пользователь может явно выбрать интересующие его документы и информации, и хранить их в частной базе данных.

Но такой подход оставляет довольно большую ответственность в руках пользователя и, вероятно, не подходит для системы, которые ожидают действительно наивных пользователей, то есть людей, которые будут использовать систему только один, а может быть, два или три раза, поскольку требуется нетривиальный опыт, чтобы иметь возможность как знать, что нужно указать, так и

как это указать.

Другой способ подойти к проблеме персонализации – предоставить системе достаточно информации о пользователе, и что он может взять на себя ответственность за свою персонализацию. Это можно сделать тривиально или разумно. А тривиальный пример – это программа, которая просит пользователя оценить свой уровень знаний в системе. Затем программа использует

этот уровень, чтобы определить, какой объем информации следует предоставлять в сообщениях об ошибках. Программа по существу содержит модели того, сколько информации люди уже имеют на каждом уровне.

Во многих системах требуется более сложный подход к автоматическому моделированию пользователей, чтобы иметь дело с обоими потребность в дополнительной информации о каждом пользователе и проблема, заключающаяся в том, что пользователи не всегда могут сообщить системе, что ей нужно знать. Примеры этой последней проблемы часто встречаются в области автоматизированного обучения (CAI). А Система CAI должна знать, что каждый отдельный ученик знает, не знает или знает неправильно. Студент, к сожалению, не всегда знает то, чего не знает, а тем более то, что знает неправильно.

Конечно, не только студенты не знают себя. Есть много доказательств в психологической литературе, подтверждающие утверждение, что люди не являются надёжными источниками информации о самих себе [см., например, Nisbett & Wilson (1977) и McGuire & Padawer- Singer (1976)]. В добавок к отсутствие точности, присущее явным моделям, есть ещё одно соображение, которое приводит доводы в пользу разрешения системы

сам строит свои пользовательские модели. Люди не хотят останавливаться и отвечать на большое количество вопросов, прежде чем они смогут воздействовать на то, для чего они пытаются использовать систему. Это особенно верно для людей, которые намерены использовать систему только несколько раз и только на короткое время. Чтобы лучше обслуживать этих пользователей, система должна формировать начальную модель как можно и пусть пользователь сразу же приступит к использованию системы. Эта исходная модель может быть основана на известных характеристиках всего сообщества пользователей системы, независимо от дополнительной информации, уже имеющейся в системе, что содержит информацию о каждом отдельном пользователе (например, его должность) и набор фактов, характеризующих нового пользователя системы.

Когда человек взаимодействует с системой, он предоставляет ей дополнительную информацию о себе. Как он приобретает эту информацию, система может постепенно обновлять свою модель пользователя, пока в конечном итоге не станет моделью этого индивидуального пользователя в отличие от канонического пользователя. При таком подходе наибольшие усилия будут затрачены на построение моделей частых пользователей, при этом гораздо меньше усилий будет затрачено на модели крайне редких пользователи, модели, которые мало что дадут с точки зрения общей удовлетворённости пользователей.

Наиболее важный вывод из решения позволить системе построить свою собственную модель пользователя tJte, основанную на взаимодействия между ними заключается в том, что большая часть информации, содержащейся в модели, будет предполагаемой. Таким образом, система должен иметь какой-то способ представить, насколько он уверен в каждом факте, в дополнение к способу разрешения конфликтов и обновление модели по мере появления новой информации. В разделе 3 будет предложено несколько способов сделать это.

 

2.3. Долгосрочные и краткосрочные модели

Обсуждая первые два из этих трёх измерений, можно было утверждать, что одна из форм пользовательского моделирования может привести к более обитаемой системе, чем другая. При обсуждении этого третьего измерения это уже не так. Для того, чтобы обеспечить условия для разумного взаимодействия с пользователем система должна иметь доступ к широкому спектру информации о нем, начиная с от относительно долгосрочных фактов, таких как его уровень математической сложности, до довольно краткосрочных фактов, таких как тема последнего предложения, введённого пользователем. Хотя вся эта информация может способствовать обитаемости системы, полезно, по крайней мере, в начале исследования темы моделирования пользователей, разделить

проблема выведения (исключения) долгосрочных моделей из проблемы вывода краткосрочных моделей, потому что различные методы могут подходит для решения двух проблем.

Вероятно, разумно потребовать, чтобы количество усилий, затраченных на принятие решения по конкретному факту о пользователе, было примерно пропорционально количеству времени, в течение которого этот факт можно будет использовать. С одной стороны, важно, чтобы

не было больших затрат времени, чтобы можно было определить столько времени тратится на попытки сделать вывод о том, что этот факт больше не актуален. С другой стороны, может быть разумным потратить много времени на несколько сеансов, чтобы сформировать точную модель некоторых по сути постоянных характеристик.

Были предприняты усилия как для долгосрочного, так и для краткосрочного моделирования отдельных пользователей. Краткосрочное моделирование важно для понимания диалога на естественном языке. Рассмотрим, например, следующий обмен:

 

Покупатель: Сколько стоит билет до Нью-Йорка?

Клерк: Одна сотня долларов.

Заказчик: Когда следующий самолёт?

Клерк: Следующий самолёт полностью забронирован, но еще есть место на одном, отправляется в 8:04.

Покупатель: ОК, возьму билет.

 

Чтобы дать такой ответ, клерк должен был сослаться на модель текущей цели клиента, чтобы добраться до Нью-

Йорка. Было бы неуместно отвечать на вопрос буквально 6:53. Если компьютерные системы будут выполнять задачу клерка в этом примере, тогда они тоже должны будут уметь строить и использовать модели целей своих пользователей. Но модели таких вещей, как текущие цели, носят довольно краткосрочный характер использования. Тот же самый покупатель может появиться завтра, намереваясь встретиться с кем-нибудь из Нью-Йорка, и таким образом ожидать другого ответа. Таким образом, необходимо разработать чрезвычайно гибкие методы, чтобы воспринимать такие цели и замечать, когда они меняются. Для более подробного обсуждения такого рода проблем см. Perrault, Allen & Коэн (1978) и Манн, Мур и Левин (1977).

Но многие системы могут с пользой использовать большое количество гораздо более стабильных знаний о своих пользователях. Эти долгосрочные модели могут быть получены в ходе серии взаимодействий между системой и её пользователями. В этой модели может содержаться такая информация, как уровень знаний пользователя в компьютерных системах в целом, его опыт с этой системой, в частности, и его знакомство с основной областью задач системы. В дополнение к этому есть общие вещи, которые могут быть использованы в самых разных системах, и пользовательским моделям, используемым в конкретной системе часто необходимо будет содержать конкретную информацию, относящуюся к системе и её области задач. Например, в Библиотечной программе, что будет обсуждаться в разделе 4, каждая пользовательская модель содержит информацию о таких вещах, как предпочтение книг с динамичными сюжетами и степень толерантности к описаниям насилия.

 

2.4. ОБЗОР ПРОСТРАНСТВА

На рисунке 1 показаны восемь классов моделей пользователей, порождённых тремя дихотомиями, которые мы только что обсудили, а также

с несколькими примерами каждого. Остальная часть этого документа будет сосредоточена на нижнем правом углу.

РИС. 1. Пространство пользовательских моделей.

3. Некоторые методы построения пользовательских моделей

Обозначив как необходимость моделирования пользователей, так и подходы, которые могут быть к нему приняты, некоторые вопросы теперь можно представить как конкретные методы, которые можно использовать для такого моделирования. В этом разделе представлены различные техники которые будут обсуждаться :

  • определение словаря и понятий, используемых пользователем.
  • оценка откликов, которыми пользователь кажется удовлетворён.
  • использование стереотипов для создания множества фактов из немногих.

Эти методы делятся на две широкие группы: методы вывода отдельных фактов на время и методы для одновременного вывода целых групп фактов. В следующих двух разделах обсуждаются эти два типа

техники.

 

3.1. УКАЗАНИЕ ИНДИВИДУАЛЬНЫХ ФАКТОВ

Один из самых простых способов получить информацию о пользователе – это посмотреть, как он использует систему. Кто-то, кто начинает сеанс с ряда расширенных команд, вероятно, эксперт. Кто-то, чьи первые попытки выполнить формы команды отклоняются системой, вероятно, что он новичок и нуждается в некоторой помощи. Простой способ реализовать моделирование пользователя на основе такого рода информации состоит в построении словаря системных команд, параметров и т.д. далее, и связать с каждым элементом указание того, какую информацию о пользователе предоставляет использование этого элемента.

Эта информация может относиться к разным параметрам, таким как опыт работы с системой и опыт работы с

основная задача. После получения эту информацию можно использовать для расшифровки ошибок пользователя и для создания сообщений с правильным уровнем описания.

Другой способ, которым пользователи предоставляют информацию о себе, – это шаблоны своих команд. Предположим, что пользователь запрашивает у системы конкретную информацию. Если он получит то, что хочет, он либо уйдёт, либо продолжит и после будет его следующий запрос. Но если он не получит то, что хочет, он, вероятно, попытается реструктурировать свой запрос в другой попытке чтобы получить то, что хотел. Эта попытка должна сигнализировать системе, что она не удовлетворила потребность пользователя с первого раза. И он не получил удовлетворяющий ответ.

Использование обоих этих методов можно проиллюстрировать кратким исследованием системы, которую мы в настоящее время используем: Building, интерактивное средство справки для системы форматирования документов, Scribe (Рейд, 1980). Пользователи этой системы могут задавать такие вопросы, как:

  • Как я могу создать индекс?
  • Почему поля такие широкие?
  • В чем разница между командой itemize и enumerate?

Система хранит свои знания о Scribe в виде набора правил «условие-действие». В простейшей форме эти правила

содержат одну команду Scribe в качестве условия, а соответствующее действие описывает эффект, производимый командой. Однако способ работы большинства команд определяется текущими значениями некоторого количества внутренних системных переменных, поэтому они тоже должны быть упомянуты как часть условий и правил. Это часто означает, что

несколько правил, каждое с разными условиями, все описывают работу одной и той же команды Scribe. В описание работы системы в соответствии с этими правилами является иерархическим. Действия, указанные во многих правилах не являются примитивными действиями, такими как размещение персонажа в определённом месте на странице, а являются более высокоуровневыми действия, и часто задействуют другие команды Scribe, эффекты которых, в свою очередь, описываются дополнительными правилами. Действие

компонентов многих правил – это установка некоторой системной переменной, которая в дальнейшем повлияет на работу других правил.

Эта иерархическая организация информации в системе позволяет такой системе отвечать на вопросы на разных уровнях детализации. Так, например, если системе задают вопрос «почему», например «Почему такие широкие поля?”, она может ответить либо указанием условий, которые привели к срабатыванию определённого правила (например, «Значение lmarg равно 10, а значение rmarg – 10»), или она может вернуться через правила, чтобы определить, как эти условия могли сбыться. Подходящий уровень для ответа на конкретный вопрос – это функция уровня самого вопроса и уровня знаний пользователя, задавшего вопрос. Для того, чтобы иметь возможность выбрать правильный уровень, система поддерживает словарь, который содержит запись для каждой из вещей

которые могут встречаться в правилах – как действия, так и условия. С каждой записью связана информация, которая описывает, когда может быть уместно упомянуть связанную концепцию в объяснении. Например, каждое

понятие имеет рейтинг, который описывает, насколько профессиональным должен быть человек в Scribe, чтобы понять объяснение с точки зрения этого. Таким образом, многие внутренние системные переменные имеют очень высокие рейтинги, в то время как простой пользователь использует часто команды с рейтингами очень низкими. У каждой концепции также есть отдельный рейтинг, который описывает уровень сложности с компьютерными системами, необходимыми для понимания этого. Например, входные файлы Scribe представляют собой блочные структуры, а файлы Scribe их обработка следует стандартной модели блочной структуры. Программист, пусть даже начинающий, как пользователь, понимает объяснение в этих терминах, в то время как более опытный программист не может.

Всякий раз, когда справочная система пытается найти ответ на вопрос, она сначала находит правило (или правила), применимые к конкретной ситуации. Затем он смотрит на концепции, упомянутые в этих правилах, и сравнивает то, что ему о них известно, и что ему известно о пользователе, задавшем вопрос. Если уровни совпадают, немедленно генерируется ответ. Если они этого не делают, система цепляется через правила, перемещаясь вверх или вниз по иерархии, в зависимости от ситуации, пока находит объяснение на правильном уровне.

Конечно, этот метод предполагает, что в справочной системе есть модель уровня подготовки пользователя. Как

можно ли построить такую сложную модель? К счастью, тот же словарь понятий, который использовался при эксплуатации модели также может быть использован для её построения. Когда пользователь задаёт вопрос, он формулирует его в терминах наблюдаемых действий (например, как символы на странице), команды Scribe и параметры Scribe. Тогда справочная система соответственно адресует этому вопрос к своей базе правил в его попытке ответить на него. Для этого он ищет каждый элемент вопроса в своём словаре (который также служит указателем в правилах). Люди часто относятся к понятиям проще, чем в большинство сложных из них, что они понимают, но они не говорят о концепциях более сложных, чем те, которые они понимают. Так система может начать построение своих моделей нового пользователя, принимая значения, связанные с первыми концепциями, которые он упоминал. Если позже будут упомянуты более сложные концепции, модель уровня знаний пользователя может быть повышена.

Модель пользователя также может быть изменена, как было предложено выше, путём наблюдения за шаблонами вопросов пользователя.

Предположим, что система неверно оценивает уровень пользователя и отвечает на его первый вопрос, ссылаясь на системный параметр, который ничего не значит для пользователя. Следующий вопрос пользователя почти наверняка будет относиться к этому параметру в попытке

выяснить, что это значит. Когда система видит это, она может сделать вывод, что её модель неверна, а затем изменить её, когда она обнаруживает уровень объяснения, которым удовлетворён пользователь. Аналогично, если система недооценивает знания пользователя, она даст ему довольно общие,  совсем общие ответы, и наверное он запросит более конкретную информацию, и затем система может обновить свою модель.

Такое моделирование пользователей очень просто реализовать. Это делает почти наверняка необоснованное предположение, что существует фиксированный порядок, в котором люди узнают что-то о системе. Хотя это предположение, вероятно, неверно, это совершенно не так неправильно. Альтернативный подход заключался бы в создании для каждого пользователя подробной модели того, что именно он знает. Такой подход необходим в системах CAI, которые должны контролировать учебные занятия с такими моделями [см., например, Self (1977)]. Но этот подход очень дорог, как с точки зрения времени, необходимого для создания модели и места, необходимое для их хранения, для большого количества пользователей. Отношения между пользователем и система гораздо более свободны в контексте справочной системы, чем в системе CAI. Пользователь сохраняет контроль над взаимодействием, и вместо использования в концентрированных сессиях для усвоения идей обычно используются справочные системы время от времени для решения конкретных проблем. Таким образом, потребность в точной модели знаний пользователя менее острая. Хотя, конечно, нет чёткой границы, которую можно провести между этими двумя типами систем, кажется, что что во многих ситуациях неполные пользовательские модели могут быть полезны для справочной системы.

 

3.2. Использование стереотипов для вывода множества вещей одновременно.

Методы, которые обсуждались до сих пор, позволяют системе делать выводы об отдельных фактах о пользователе. Но если пользовательская модель должна быть очень сложной, то возникает вопрос о том, как собрать всю необходимую информацию в разумные сроки времени. Возможно, у пользователя будет только несколько обменов с системой, поэтому моделирование пользователя, которое требует множества от взаимодействия для построения исходной модели будет иметь мало пользы. К счастью, во многих ситуациях можно наблюдать одну или небольшое количество фактов и из них вывести с достаточной степенью точности набор дополнительных фактов. Человеческие черты не распределяются в популяции полностью случайным образом. Скорее они часто встречаются группами. Эти

кластеры могут возникать по разным причинам, например, из-за наличия единственного фактора, который заставляет несколько черт присутствуют сразу, или наличие причинной цепи между самими чертами. Например, богатый человек вероятно, путешествовал больше, чем другой очень бедный человек.

Люди представляют такие знания о сопутствующих чертах характера в виде набора стереотипов. Хотя слово стереотип имеет много негативных ассоциаций, важно ограничить его использование здесь чисто описательными перечислениями набора признаков, которые часто встречаются вместе. С этой точки зрения стереотип – это просто способ охвата некоторых структур, существующих в мире вокруг нас. За последние пару десятилетий работы в искусственного интеллекта, мы пришли к пониманию масштаба знаний, необходимых для рассуждений о

Мире К счастью, мы также обнаружили, что это знание имеет большую структуру, которая, если она может быть

захвачено, значительно ограничивает то, что необходимо учитывать в любой момент. Например, события не происходят случайно. Вместо этого обычные шаблоны событий, такие как вход в ресторан, получение меню, заказ, есть и платить. Эти шаблоны событий привели к разработке сценариев (Schank & Abelson, 1977), которые оказались чрезвычайно полезными при создании программ для понимания описаний событий, например, в газетных статьях. Стереотипы обеспечивают аналогичную структуру информации о людях. Только поскольку сценарии полезны для рассуждений о событиях, необходимых для понимания газетных статей, стереотипы полезны для рассуждений о людях, необходимых для построения пользовательских моделей. В частности, они могут предоставить способ формирования правдоподобных выводов о ещё невидимых вещах на основе вещей, которые были наблюдаемы.

Стереотип представляет собой набор черт. Его можно представить как набор пар атрибут-значение. Мы будем

назыввть каждый такой атрибут гранью. Модель отдельного пользователя также может быть представлена в виде набора граней (фасетов), заполненных ценностями. Грани стереотипов, используемых системой, должны соответствовать аспектам пользовательских моделей, построенных системой. Например, одна из черт, которую может быть полезно рассмотреть, – это уровень опыта пользователя с конкретной системой. Таким образом, модели отдельных пользователей, а также соответствующие стереотипы будут содержать аспект «опыта», который может принимать значения, скажем, от 1 до 10.

Некоторые черты легко заметить. Они служат триггерами, вызывающими активацию всего стереотипа.

Поскольку наличие какой-либо черты может указывать только на определённый стереотип, а не на абсолютное свидетельство в его пользу, с каждым триггером связан рейтинг, который является приблизительной мерой вероятности того, что стереотип уместен, учитывая, что триггер соблюдён. Конечно, это не только взаимосвязь между триггерами и стереотипами, которые в лучшем случае наводят на размышления. Стереотип говорит только о том, что набор черт часто встречается вместе, а не о том, что они всегда так делают. Итак, с каждым аспектом стереотипа должен быть связан рейтинг, оценивающий вероятность проявления соответствующей черты с учетом уместности стереотипа.

Стереотипы представляют собой структуру черт. Часто существует дополнительная структура, которую можно зафиксировать представленим набора стереотипов в виде иерархии. Информация в общих стереотипах может использоваться, если только противоречивую информацию подсказывают более конкретные стереотипы. Самый общий стереотип, доступный системе может представлять модель канонического пользователя. Таким образом, даже без большого количества информации система, построенная на стереотипах, будет работать не хуже, чем модель, построенная на традиционной встроенной модели канонического пользователя.

Одна из наиболее важных проблем, которую необходимо решить в любой системе моделирования пользователей на основе выводов из поведение пользователя заключается в том, как обнаруживать и разрешать конфликты между выводами. Чтобы облегчить это, рейтинги привязаны как к триггерам, так и к каждому предсказанию (аспекту) каждого стереотипа. Кроме того, каждая грань индивидуальной модели пользователя должна содержать не только значений, но и оценку уверенности системы в этом значении (которое может быть используется для определения того, насколько значение должно влиять на производительность системы в целом) и список причин, по которым считается ценность. Этот список причин важен. Например, предположим, что стереотип активируется в результате наблюдаемых черт пользователя. Этот стереотип предсказывает ценность определённого аспекта, но системная модель пользователя уже содержит другое значение для этого аспекта. Если система вспомнила, откуда взялось это значение, то можно довольно легко разрешить конфликт, например, если более раннее значение было получено из

стереотипа более общего, чем тот, который только что активизировался.

Иногда несколько разных стереотипов могут предсказывать одно и то же значение, а не разные для аспекта. В этом случае уровень уверенности системы в прогнозе может быть выше, чем если бы только один источник где информация присутствовала бы. Поскольку стереотипы разумно предсказывают другие стереотипы и в частности, пары значений для прогнозирования стереотипов, приток новой информации может потребовать распространения изменений рейтинга во всей пользовательской модели. Точная степень эффективности продолжения такого распространения – это вопрос, который необходимо определить эмпирически.

Все эти методы комбинирования выводов, основанных на различных стереотипах, можно обобщить, чтобы сформировать основу для интеграции более широкого спектра источников знаний об отдельном пользователе. Как бы полезны стереотипы не были, позволяя довольно быстро совершать начальное построение модели пользователя, они не исключают необходимости в других видах информации, включая как ответы на прямые вопросы, так и другие косвенные методы, описанные выше в контексте помощника Scribe. Но однажды каждый элемент пользовательской модели сопровождается рейтингом и списком доказательства, подтверждающих что в это, легко добавить произвольные источники знаний. Новая информация, поддерживающая старые значения вызывает повышение рейтингов, присваиваемых значениям. Новая информация, которая противоречит старым ценностям, вызывает средство разрешения конфликтов для проверки достоверности конкурирующих голосов для получения столь же точной оценки правды, как и возможный. Ответам пользователя на прямые вопросы можно отдать приоритет перед простыми выводами, которым, в свою очередь, могут быть

отдан приоритет предсказания стереотипов.

До сих пор обсуждение использования стереотипов было общим и избегало ссылок на конкретные системы или домены задач. В следующем разделе описывается конкретная система, которая успешно использовала стереотипы для построения моделей своих пользователей, которые будут обсуждаться. Общие моменты, упомянутые в этом разделе, будут проиллюстрированы конкретными примерами.

4. Гранди: пример использования стереотипов.

Для проверки многих идей, изложенных выше, была создана пилотная система под названием Grundy (Гранди). Гранди программа, которая рекомендует романы, которые люди могут захотеть прочитать. Для этого он использует два набора данных:

  • описания отдельных книг. Каждое описание представляет собой набор аспектов, заполненных соответствующими значениями.
  • стереотипы, содержащие аспекты, относящиеся к книжному вкусу людей. С каждым стереотипом связан

сборник триггеров.

Кроме того, Гранди обладает некоторыми знаниями о каждом из аспектов, которые могут встречаться в стереотипах. Это знание используется, чтобы помочь разрешить конфликты между конкурирующими выводами, а также для отображения информации в пользователе модели к информации в книжных описаниях. Для более полного описания Гранди, чем представленное читать здесь здесь см. Rich (1979a, b).

Когда новый пользователь начинает разговор с Гранди, его или её просят сказать несколько слов, которые, по его мнению, дать хорошее самоописание. Гранди использует эти слова как триггеры для соответствующих стереотипов, и начинается построение своей модели пользователя. Обычно на этом этапе активируется несколько стереотипов и часто возникают конфликты среди их прогнозов, которые Гранди решает как можно лучше. Затем Гранди оценивает (используя комбинацию количества вещей, в которые он верит, и насколько сильно он им верит) достаточно ли информации для начала процесса, что бы рекомендовать книги. Если да, то Гранди идет вперед. Если этого не происходит, он просит пользователя сказать ещё несколько слов.

На рисунке 2 показаны два стереотипа, использованных Гранди. На рисунке 3 показано, как будет выглядеть модель пользователя Гранди, например, после того, как ему сказали имя пользователя (и вывели из него, что она женщина) и после специальной активации

ЖЕНСКИЕ, ФЕМИНИСТИЧЕСКИЕ И ИНТЕЛЛЕКТУАЛЬНЫЕ стереотипы. Каждый раз, когда Гранди активирует стереотип, он также активирует все обобщения этого стереотипа, поэтому стереотипы ОБРАЗОВАННЫЙ и ЛЮБОЙ (канонический модель пользователя) также были активированы. Обратите внимание, что каждый из стереотипов содержит только некоторые аспекты, что содержится в полной пользовательской модели. Это часто происходит, потому что многие стереотипы связаны только с одним (или, возможно, с несколькими) важные аспекты человека.

РИС. 2. Некоторые образцы стереотипов Гранди.

После того, как он накопит достаточно информации, чтобы начать работу, Гранди начинает рекомендовать книги по одной, пока пользователь говорит ему остановиться. Процесс выбора книги происходит следующим образом.

  1. Выберите заметный фасет в пользовательской модели. Существенными аспектами являются те, которые имеют не средние ценности и высокие рейтинги.
  2. Используйте перевёрнутый индекс в базе данных книг, чтобы выбрать все книги, предложенные этим конкретным значением аспекта.
  3. Сравните каждую из выбранных книг с моделью пользователя по всем параметрам. Исключите книги, превышающие определённые пороги (например, терпимость к насилию).
  4. Из книг, которые не были исключены, выберите ту, которая лучше всего подходит. Если он выше порога близости совпадения, Гранди рекомендует. В противном случае перейдите к шагу 1, выберите новый фасет и повторите попытку.

РИС. 3. Пример пользовательской модели Grundy.

 

Выбрав книгу, Гранди сообщает пользователю имя ее автора и название, а затем спрашивает пользователя, читал ли он это раньше. Если да, Гранди знает, что он на правильном пути. Теперь он может укрепить свою веру в то, что привело его к выбору этой книги. (См. Раздел 5 для более подробного обсуждения вопроса об изменении базы данных Гранди.) Если пользователю книга не понравилась, Гранди нужно выяснить, почему. В идеале было бы просто сказать: «Почему бы и нет?», Но гораздо больше потребуются знаний, чем у Гранди, для интерпретации ответов на такой вопрос . Например, кто-то может сказать, что книга ему не понравилась, потому что главный герой напомнил ей ее дантиста. Вместо этого Гранди пытается выяснить, какое из представлений о пользователе, которое он использовал при выборе этой книги, было неправильным. Для этого он

Задаёт несколько прямых вопросов, пока не обнаружит проблему или не откажется от неё. Если он обнаружил проблему, то он может обновлять как свою модель пользователя, так и свою базу стереотипов.

Если пользователь говорит Гранди, что она не читала книгу, Гранди сообщает ей некоторые вещи, которые, по его мнению, могут заинтересовать её. Гранди использует свою модель пользователя, чтобы выбрать, какие характеристики книги следует упомянуть. Затем он спрашивает. что пользователь думает, что книга ему может понравится. На этот раз, если она скажет «да», Гранди ничего не сделает, поскольку положительный ответ основан только на нескольких фактах, которые видел пользователь. Но если пользователь говорит, что книга не смотрится интересной, то Гранди использует описанную выше процедуру, чтобы попытаться выяснить, что пошло не так, чтобы он мог попытаться найти то, что ей больше понравится.

Чтобы проверить полезность пользовательских моделей Гранди, был проведён эксперимент, в котором Гранди дал каждому из пользователей столько предложений, сколько они хотели. Он также дал каждому из них несколько случайно выбранных предложений без помощи модели пользователя и спросил их, хорошо ли выглядят предложения. Они послужили контролем.

В таблице 1 показан процент предложений, которые были описаны как хорошие, по сравнению с предложениями, описанными как плохие в управляемом режиме (где выбор определяла модель пользователя) и в случайном режиме. Эти цифры показывают, что Гранди значительно (p <10-9) работает с пользовательской моделью лучше, чем без неё.

Хотя модели пользователей Гранди и близко не подходят к улавливанию всех сложно связанных факторов, которые

определяют, какие романы понравятся человеку, его успешность при внесении предложений указывает на то, что пользовательские модели могут служить полезным руководством для интерактивных систем.

Таблица 1.

Полезность пользовательских моделей Гранди

5. Обучение в Гранди

Стереотипы чрезвычайно полезны, позволяя системе быстро построить начальную модель нового пользователя, чтобы она могла заниматься тем, что является настоящей задачей. Но как мы можем выработать точные стереотипы для использования в системе? Будут ли такое, что все попытки моделирования пользователей окажутся бесполезными, если стереотипы неверны? Это важные вопросы, которые все ещё требуют полных ответов, но опыт работы с Гранди показывает, что они не представляют собой непреодолимых препятствий.

Первоначальные стереотипы Гранди отражали лишь мои интуитивные представления о людях и книгах, которые они читают. Попытки не было сделано для сбора любых достоверных данных. Несмотря на это, стереотипы очень полезны. Но самое интересное, что может быть наблюдается, что Гранди способен изменять свои стереотипы на основе своего опыта, когда этот опыт

противоречит предсказаниям стереотипов. Возможны только довольно простые модификации. Фасеты не могут быть добавлены или удален, но значение фасета может измениться, как и его рейтинг.

Первоначальный стереотип Гранди о типичном читателе -мужчине указывал на то, что мужчины любят читать книги с динамичными сюжетами, и получать много острых ощущений и азарта. Это может относиться к мужскому населению США. Но мужчины Гранди

на самом деле, как мы видели, были не очень широкими слоями этого населения; все они были преподавателями и выпускниками университета, студентами. Поэтому им нравились интеллектуальные книги, которые больше касались философии, чем сюжета. Так Гранди постепенно изменил свой стереотип MAN, чтобы отразить вкусы людей, которых он действительно видел,чем какое-то население, которое я себе представляла. Тот факт, что он мог это сделать, предполагает две обнадеживающие вещи о достоинствах использования стереотипов в системах моделирования пользователей:

  • наличие точных данных, описывающих сообщество пользователей, не критично для построения первоначального набора стереотипов.
  • если одна система используется в различных сообществах, ее стереотипы могут развиваться отдельно в каждом из них, потому что каждый характеризуется довольно точно.

Конечно, возможны и другие типы обучения, которых Гранди не делает. Grundy хранит все свои пользовательские модели, потому что, когда пользователь возвращается для более поздних сеансов, новую модель не нужно строить с нуля. Таким образом можно было бы создавать совершенно новые стереотипы, наблюдая за образцами черт, которые обычно встречаются у пользователей.

6. Заключение

В этой статье я утверждала, что для многих интерактивных компьютерных систем сообщество пользователей достаточно неоднородно, что единственная модель канонического tiser неадекватна. Вместо этого представляется возможность формировать индивидуальные модели отдельных пользователей. А потом я показала, что такие модели, помимо необходимости, также возможны, и был представлен набор способов их создания и использования.

Все эти методы объединяет то, что они предполагают предположения о пользователе. Эти догадки

производится системой на основе её взаимодействия с пользователем. В результате возможность ошибки всегда должна быть просчитана. Чтобы справиться с этим, система должна делать две вещи:

  • она должна давать оценки и обоснования каждому из своих убеждений.
  • она не должна рассматривать модель пользователя как фиксированную, а скорее как нечто, что можно постоянно улучшать путем сбора отзывов пользователей о каждом взаимодействии.

 

Ссылки

КАРТА, С.К., МОРАН, Т.П. и НЬЮЭЛЛ, А. (1980). Модель уровня нажатия клавиш для оценки времени работы пользователя с интерактивными системами. Сообщения Ассоциации вычислительной техники, 23, 396-410.

 

CODD, EF (1974). Семь шагов к рандеву со случайным пользователем. В KLIMBIE, JW & KOFFEMAN, KL,

Редакторы, Управление базой данных. Амстердам: Северная Голландия.

 

КАФФ, Р. Н. (1980). На случайных пользователей. Международный журнал человеко-машинных исследований, 12, 163-187.

 

ФИТТС, П.М. и ПЕТЕРСОН, Дж. Р. (1964). Информационная емкость дискретных двигательных реакций. Журнал Экспериментальная психология, 67, 103-112.

 

ГЕНЕЗЕРЕТ М. (1978). Автоматизированный пользовательский консультант MACSYMA. Кандидат наук. докторская диссертация, Гарвардский университет.

 

ХАДЖЕНС, Джорджия, и БИЛЛИНГСЛИ, Пенсильвания (1978). Пол: недостающая переменная в исследовании человеческого фактора. Человеческие Факторы, 20, 245-250.

 

ЛЕДГАРД, Х., УАЙТЗИД, Дж. А., Сингер, А. и СЕЙМУР, В. (1980). Естественный язык интерактивных

системы. Сообщения Ассоциации вычислительной техники, 23, 556-563.

 

LOO, R (1978). Индивидуальные отличия и восприятие дорожных знаков. Человеческий фактор, 20, 65-74.

МАНН, У.С., Мур, Дж. А. и Левин, Дж. А. (1977). Модель понимания человеческого диалога. В

Труды Международной объединённой конференции по искусственному интеллекту, 5, 77-87.

 

МАКГУИР, У.Д. и ПАДАВЕР-ЗИНГЕР, А. (1976). Особенность спонтанной самооценки. Журнал

Личность и социальная психология, 33, 743-754.

 

МИТТМАН Б. и БОРМАН Л. (1975). Системы персонализированных баз данных. Лос-Анджелес: Melville Publishing Co.

 

НИСБЕТТ, Р. Э. и УИЛСОН, Т. Д. (1977). Рассказывать больше, чем мы можем знать: устные отчеты о психических процессах. Психологический обзор, 84, 231-259.

 

Перро, К. Р., Аллен, Д. Ф. и КОЭН, П. Р. (1978). Речь служит основой для понимания диалога согласованности. В материалах Второй конференции по теоретическим вопросам обработки естественного языка

 

РИД, Б.К. (1980). Scribe: язык спецификации документов и его компилятор. Кандидат наук. диссертация, Карнеги-Меллон Университет.

 

РИЧ, EA (1979a). Создание и использование пользовательских моделей. ‘Кандидат наук. защитил диссертацию в Университете Карнеги-Меллона.

 

РИЧ, EA (1979b). Моделирование пользователей с помощью стереотипов. Когнитивная наука, 3, 329-354.

 

РОБЕРТСОН, Г., НЬЮЭЛЛ, А., РАМАКРИШНА, К. (1981). Подход ZOG к человеку-машине

общение. Внутренний журнал исследований человека и машины, 14 (4), 461-488.

 

SCHANK, R. & ABELSbN, R. P. (1977). Цели, планы, сценарии и понимание: исследование человека

Структуры знаний. Хиллсдейл, Нью-Джерси: Erlbaum Press.

 

СЕЛФ, JA (1977). Концепция обучения. Искусственный интеллект, 9, 197-221.

 

СМИТ, С. (1979). Размер букв и удобочитаемость. Человеческий фактор, 21, 661-670.

 

ThesisOwl

What is our mission?

Language barriers are being broken down around the world. Business and enterprise are becoming multilingual. We live in an era when having an understanding of multiple languages is key. If you are multilingual, you can pursue a range of new opportunities. Also, learning new languages helps your personal development and gives you goals to work towards.

We see the importance of language in our modern society. In particular, we understand that language is vital in the study of things like research papers and other academic documents. This is why we have created ThesisOwl – a multilingual platform dedicated to research assistance in multiple languages.

Regardless of the language or research paper type, we can assist – translations and language is our speciality. If you need a document in a particular language, fear not. Our team of dedicated and skilled linguists can help instantly and provide you with the information you require.

More about us

Our team is dispersed across multiple countries. We feel this is important so that we can have a group of employees who are fluent in different languages. Regardless of how efficiently you learn a language, there is no substitute for someone who has spoken a native language from birth.

Due to our multi-national locations, our staff excel in different languages. Also, we have a high level of English language skills. This means that our work is of an exceptional standard. This includes vocabulary, grammar, and use of colloquial phrases etc.

Using our own expert knowledge of English and other languages, we help students who do not have the same understanding. We enable them to expand their language skills through research paper translations and other useful documents.

We also know that translation goes beyond a simple comprehension of words. It permeates other aspects of our lives and helps us have a greater understanding of things like culture and social differences. It can help students greatly and contribute to an improvement in education too.

Perfect translation is imperative

An underlying understanding of language is essential to deliver an accurate, quality article for students that need it. The translator must have an extensive knowledge of both languages so that the article is credible, but also so that the meaning of the article is maintained.

This includes understanding grammar, correct verb usage, and how words are used in different cultures. Also, this understanding needs to cross different subjects. The translator must be able to use the language in any circumstance – whether a historical account, a scientific research paper, or a poem, for example.

The mastery of translation is therefore key to success. An effective translation is imperative for students who want to score high marks and utilize these documents in the right manner. This is exactly what our experts can provide.

What services do we provide?

Our translation experts provide language services for any purpose. This could be dissertations, assignments, research papers, or a thesis, for example.

ThesisOwl was created to provide a multilingual service for students. We want to eliminate language barriers and ensure that all students have access to the resources they need, regardless of what language it is written in.

If you feel like you could benefit from such a service, simply email us the document or text you require translating, and any other important information you feel is relevant. We will do the rest and translate the document into the language you require!