Личный блог Дмитрия Подлужного: о работе и около нее

Количественные метрики на базе GOMS

Проектирование, 14 июля 2022

GOMS это семейство методов, позволяющих провести моделирование выполнения той или иной задачи пользователем и на основе такой модели оценить качество интерфейса (точнее говоря оценить время выполнения задачи как основной критерий качества). GOMS  —  сокращение от английского Goals, Operators, Methods, and Selection Rules — Цели, Операторы, Методы и Правила выбора. Данный способ был предложен S. K. Card, T. P. Moran и A. Newell в 1983 году.

Метод заключается в том, что все действия пользователя в рамках выполнения сценария можно представить как набор типовых операций, например, нажатие той или инуй кнопки на клавиатуре, передвижение курсора мыши, и т.п., и результат всех действий может быть подсчитан.

Варианты метода

Card, Moran and Newell GOMS (CMN-GOMS) — оригинальная формулировка, предложенная Кардом, Мораном и Ньюэллом. Определяет то, как выразить в иерархии главную цель и подцели, методы и операторы, и как формулируются правила выбора.

Cognitive Perceptual Model (CPM) — эта модель предполагает, что перцептивные (имеющий отношение к чувственному восприятию), когнитивные (связанные с обработкой информации нашим сознанием) и моторные операторы могут выполняться параллельно. Для изображения операторов и зависимостей между ними используется график (т.н. PERT диаграмма). Последовательность, которая представляет собой самый длинный путь на графике, называется критическим путем и является оценкой общего времени, необходимого для выполнения данной задачи.

Keystroke-level Model (KLM) — упрощенная версия CMN модели, в которой используются только операторы, нет целей, методов или правил выбора. Аналитик просто перечисляет нажатия на клавиши, движения мышью, которые должен произвести пользователь, чтобы решить задачу, а затем использует несколько простых эвристических правил, чтобы расставить операторы М — операторы ментальной подготовки.

Natural GOMS Language (NGOMSL) — более строго определенная версия, представляет собой процедуру выявления всех GOMS компонентов, выраженную обычным языком программирования. NGOMSL включает в себя эмпирические правила о количестве возможных шагов в методе, как ставить и завершать постановку целей, и какую информацию должен помнить пользователь, решая задачу.

Когда можно использовать?

Для экспертной оценки эргономических качеств интерфейса. Подходит для сравнения множества альтернативных решений при проектировании интерфейса. Производиться расчет действий пользователя и сравнения разных вариантов интерфейса.

Какой ожидать результат?

Зависит от выбранного метода. Я рекомендую использовать Keystroke-level Model (KLM), как наиболее распространенный и простой. При его использовании мы можем получить:

  • Сравнение различных сценариев,
  • Проверить покрытие прототипами и дизайном всего продукта, 
  • Проверить сценарии на полноту отображения взаимодействия пользователя и системы. 

Вариант описания методики David Kieras, 2001: https://www.researchgate.net/publication/2848715_Using_the_Keystroke-Level_Model_to_Estimate_Execution_Times

Проведение

  1. Выбрать метод.
  2. Подготовить таблицу оценки.
  3. Выбрать один или несколько типичных сценариев задач.
  4. Определите дизайн так, чтобы действия могли быть перечислены для конкретных задач.
  5. Для каждого сценария определите наилучший способ выполнения задачи или способ, которым, как вы предполагаете, будут идти пользователи.
  6. Перечислить действия и соответствующие физические операторы, участвующие в выполнении задачи.
  7. При необходимости указать операторы, когда пользователь должен ждать ответа системы.
  8. Вставить мысленные операторы, когда пользователь должен остановиться и подумать.
  9. Посмотреть стандартное время выполнения для каждого оператора.
  10. Сложите время выполнения для операторов.
  11. Общее время оператора — это расчетное время выполнения задачи.
  12. Подсчитать результат.

Описание операторов

Здесь приведены значения по методике KLM с небольшой модификацией в виде опера “S” для обозначения прокрутки экрана браузера. Этот оператор мы ввели в практику, чтобы адаптировать метод для проверки длинных веб-страниц.

K — нажатие клавиши (0.12–1.2 с; 0.28 рекомендуется для большинства пользователей). Этот оператор нажимает клавишу или кнопку на клавиатура. Нажатие клавиши SHIFT или CONTROL считается отдельным нажатием клавиши. Различные уровни опыта имеют разные времена для оператора K:

  • Эксперт машинистка (90 wpm): 0.12 сек
  • Средний квалифицированный машинист (55 wpm): 0.20 сек
  • Средняя машинистка (40 wpm): 0.28 сек
  • Худшая машинистка (незнакомая с клавиатурой): 1.2 сек.
  • Средняя машинистка (0.28 сек) является хорошим ориентиром для характеристики типичного пользователя;

T (n) — введение последовательности из n символов на клавиатуре (n * K сек). Этот оператор вариант оператора K, обычно используется для удобства записи и только тогда, когда пользователь печатает строку символов.

P — Перемещение указателя мыши на цель на дисплее (1.1 сек). Этот оператор представляет действие перемещения мышь, чтобы навести курсор на нужное место на экране. Для типичных ситуаций он составляет от 0.8 до 1.5 сек, в среднем 1.1 сек.

B — Нажатие кнопки мыши (0.1 сек). Очень быстрое движение. Значение 0.1 сек для нажатия на кнопку или отпускания ее.

BB — Двойное нажатие кнопки мыши (0.2 сек).

H — Перемещение руки на мышь или клавиатуру (0.4 сек).

S — Скрол страницы больше чем на экран — 0.4 сек. Оператор введен, чтобы учесть время, которое требуется на доскрол до нужного места на длинной странице.

М — Ментальный акт рутинного мышления или восприятия (0.6–1.35 сек; использование 1.2 сек). Конечно, сколько времени нужно, чтобы выполнение умственного действия зависит от того, какие когнитивные процессы вовлечены, и сильно варьируется от ситуации к ситуация или человек к человеку. Этот оператор основан на том факте, что когда задействованы достаточно опытные пользователи при обычной работе компьютера в потоке действий возникают паузы длительностью около секунды, которые связанные с рутинными действиями, такими как запоминание имени файла или поиск чего-либо на экране. Оператор М предназначен для представления этого обычного мышления, а не сложного, длительного, решения проблем.

На основании имеющихся результатов (Olson & Olson, 1990), хорошая общая оценка продолжительности M составляет 1.2 с.

Выбор количества M и места их появления — сложная часть использования KLM. Здесь можно опираться только на здравый смысл, но сам оператор важен для корректной оценки сценариев. Например, если для принятия решения пользователю нужно прочитать несколько абзацев текста, то это существенно повлияет на время выполнения сценария и это надо учитывать.

W (t) — ожидание ответа системы (необходимо определить время t). Это время, когда пользователь должен ждать ответа системы, прежде чем он или она может продолжить действия дальше. Обратите внимание, что оно не обязательно совпадает со временем, требуемым системой для ответа, потому что пользователь может перекрывать другие действия во время работы системы.

Пример расчета

Пример использования

Использование метод можно для разных целей, но в своей практике, я чаще использую его для проверки функционального покрытия системы в процессе проектирования прототипов.

Пример задач, которые ставились перед исследованием:

  • Проверить в полном ли объеме спроектированы пользовательские сценарии. 
    Моя предпосылка: если возможно построить цепочку пользовательский действий по методики GOMS, то можно считать, что сценарий полностью спроектирован, т.е. на прототипах можно пройти все состояния требующиеся для достижения пользователем цели.
  • Выделить длинные сценарии, которые могут требовать дополнительного внимания.
    Существовало опасение, что при функциональной декомпозиции могли оставаться очень длинный пользовательские сценарии, в которых легко допустить ошибку. И хотелось проверить не попадаются ли такие сценарии, чтобы обратить на них дополнительное внимание.

Для удобства работы был создан файл с реестром сценариев и написал небольшой скрипт для Google Sheets, который помогал считать время по пользовательским операциям. Пример итоговой таблицы и ссылка на копию файла приведены ниже.

Пример файла в Google Таблицы

В заключение

Метод GOMS появился до широкого распространения ИТ технологий, претерпел несколько трансформаций и был успешно позабыт. При этом, наряду с многими другими эффективными методиками, его использования позволяет решать важные задачи в проектировании.

Я надеюсь, что данная статья помогла вам разобраться в том, что же такое GOMS и подскажет варианты применения данного метода в вашей практике.

Подлужный Дмитрий Арнольдович

Об авторе

Дмитрий Подлужный – UX дизайнер, который ищет решения на границе пользовательских потребностей, бизнес целей и технических ограничений.