早稲田大学石田研究室


主課題を用いたワークロード評価法の検討

曽我部 真樹


1.はじめに

近年の作業システムの特徴として,航空機の操縦や官制業務,原子力発電所の運転や宇宙開発に代表されるように,システムの巨大化を指摘することができる.こうしたシステム化において,作業に従事するオペレータのエラーがシステム全体に及ぼす影響は非常に大きくなったといえる.特に,長時間にわたる情報の読み取り,的確な判断と行動のための注意の持続,不具合が生じた時の極度の緊張などはワークロードが高い状況とされ,このような状況の継続は,中枢神経機能の失調や意欲の減退,延いては慢性的な疲労へ発展するなど,精神衛生的な見地からも問題視されている.それゆえ,ワークロードの観点から作業量や作業の難易度を適正に保つことは非常に重要であるとされている.

既存のワークロードの評価法では,主観評価・生理反応・反応動作の3側面から測定が必要とされている(大須賀ら,1993)が,実際の労働環境における評価では問題点も存在する.心拍変動や脳波などに代表される生理的指標では,意図的な操作がしにくいこと,本人が気づいていない反応を検出できることなどの利点がある一方で,電極や測定用の機材などが必要であることが難点である.また,NASA-TLXやSWATなどのような主観的な指標は人間の内観や主訴が直接的に得られる特徴があるが,回答をするために途中で作業を中断しなければならないという問題がある. 行動的指標に関しては,主課題(メインの作業)とは別の二次的なタスクを課し,そのパフォーマンスの変容から評価するという二重課題法が広く利用されているが,実験条件下以外では困難であり,現実的な場面での有効性や適用性は低いと考えられる.

以上のことにより,実際の労働環境における評ワークロードの評価手法に求められる要件は,評価を行うために新たな課題の実施を要さず,かつ,電極貼付のような接触式の評価ではないことが挙げられる.そこで,本研究では,評価指標として主課題のパフォーマンスを取り上げることとする.

2.目的

主課題におけるパフォーマンスの変動が,ワークロード指標となり得るかどうかを検討する.

3.実験方法

3-1.被験者

大学生及び大学院生20名(男女各10名ずつ). 平均年齢は22.1歳.

3-2.作業課題

右手のみを使用した5文字文字列のキーボード入力.

3-3.実験方法

心電図(ECG)計測のための電極を装着した上で,5分間の安静状態の心電図(ECG)の測定を行った.その後,練習試行として5分間のランダム文字列入力を行い,終了後にはNASA-TLXによる主観的ワークロードの評価を求めた.

本試行では,まず5分間の英単語の入力とNASA-TLXの記入を行い,その後,ランダム文字列の入力を5セッション実施した.ランダム文字列入力の制限時間は5セットで1時間とし,ペース配分は被験者に委ねた.なお,セッション間にはNASA-TLXによる評定を求めた.ランダム文字列1セッションの作業量は,予備実験の結果を基に,1枚あたり60語×2枚としたことから,予想される所要時間は約10分×5回で50分程度となり,10分程度のゆとりがあることになる.ランダム文字列の5セッション目が終了した後で,再び5分間の英単語による試行を行い,NASA-TLXによるワークロード評価を求めた.

なお,全ての試行を行うに当たり,正確に入力すること,入力後は誤りがないか確認することを求めた.

作業と測定の流れ
図1 作業と測定の流れ

4.結果

被験者20名のうち,教示の理解が不十分であったために,課題達成量が顕著に少なかった1名を除く19名のデータを分析に用いた.心電図においては,R-R間隔のとれていない2名のデータを除き,17名のデータを分析に使用した.また, 一部の被験者が5試行目の作業に到達しておらず,データ量が不十分なため,分析には4試行目までのデータを使用した.なお,分析に使用した試行ブロックは英単語の1回目を英単語1,2回目を英単語2,各ランダム課題を2枚ごとにランダム1・ランダム2・ランダム3・ランダム4とした.

各指標の分析には,生理的指標,主観的指標,パフォーマンスの3つのデータを分析した.主観的指標データについては質問紙上の10cmの線分上で評価されたNASA-TLXの各尺度,疲労感の評価値は100段階で数値化し,各尺度の単純総和をR-TLX値とした.心電データについてはR-R間隔を算出し,安静時における心電R-R間隔を1とした場合の,各試行ブロックのR-R間隔平均の変動率を分析に使用した.キー間隔時間はコンピュータプログラムにより,全入力キー間隔時間を記録し,分析を行った.また,キー間隔は1単語入力の内分けを文字入力,最後の文字からエンターキーまで(文字列確認),エンターキーから次の最初の文字を打ち込むまでの3つに分割し,それぞれの間隔時間について分析した.

4-1.主観的指標(NASA-TLX)

主観的指標として,R-TLX(TLX下位尺度の単純総和),TLX下位尺度,疲労感の3つを分析した.その結果,これら全てに共通して,ランダム試行は英単語試行よりも有意に評価値が高いという結果が得られた.さらにランダム試行内に関しては,ランダム4が最もワークロードが高く,ランダム2・3は中程度,ランダム1については最も低かったと言える.

NASA-TLX下位尺度評価値平均の推移
図2 NASA-TLX下位尺度評価値平均の推移
(尺度の略称は次のとおり MD:知的・知覚的要求 PD:身体的要求 TD:タイムプレッシャー OP:作業成績 EF:努力 FR:フラストレーション AL:全体的負荷 FG:疲労感)

ランダム試行内においてはNASA-TLXと心拍は正の相関が高く(r=0.98),NASA-TLX評価値が高くなるにつれて,心拍数は減少する.精神的作業では心拍数が減少することが知られている(高野ら,1982)ことから,今回の作業は精神的ワークロードが高かったと考えられる.

これらの結果から,ランダム課題では試行を重ねるごとにワークロードが高くなると考えられる.

4-2.生理指標(心拍数)

心電R-R間隔の変化率は課題開始直後の英単語1において値が急激に減少し,その後単調に増加した.

心電R-R間隔変化率平均の推移
図3 心電R-R間隔変化率平均の推移

4-3.パフォーマンス

4-3-1.キー入力時間の変化

文字入力時間,文字列確認時間,エンターキーから次の最初の文字を打ち込むまで,全入力キー間隔,それぞれについてブロックごとの分散分析を行った.また,前の文字列のエンターキー入力から次の文字列入力確認後のエンターキー入力までの時間を算出して1単語入力時間とし,各ブロックの分散分析を行った.なお,分析は,英単語を含んだ全体のものと,ランダム試行内のみでの2パターンで行った.

@ 英単語試行を含めての分析

全入力キー間隔,文字キーのみの入力間隔時間,文字列確認時間,次の作業に取り掛かるまでの間隔時間,1単語入力所要時間いずれにおいても英単語の方が有意に短いという結果が得られた.

Aランダム試行内のみでの分析

全入力キー間隔,文字キーのみの入力においては,ランダム4がランダム試行の他の各ランダム試行に比べ,入力間隔が有意に減少していた.また,文字列確認時間,1単語入力所要時間についてはランダム試行内のみでの分析では各試行ブロックでの有意差はなかった.

各キー間隔平均時間の推移
図4 各キー間隔平均時間の推移

1単語入力平均時間の推移
図5 1単語入力平均時間の推移

4-3-2.外れ値を抜いたキー間隔の分析

全てのキー間隔を含めて分析をすると,突発的な遅れによる,長い時間を要したキー入力値の影響を受ける可能性がある.そこで,各被験者の全課題におけるキー間隔の95パーセンタイル値を算出し,該当するキーデータを除外して,先述と同様の分析を行った.なお,データはランダム試行ブロック内のみを分析に使用した.

その結果,全入力キー間隔,及び文字キー入力間隔については,ランダム1・2よりもランダム4の方が有意に短いという結果が得られた.また,1単語あたりの所要時間における試行ブロックの主効果(F(3,54)=5.000,p<.01)は有意であった.各試行ブロックを多重比較したところ,ランダム1とランダム4にのみ有意差 (p<.01)が見られた.

キー間隔全体平均時間の推移
図6 キー間隔全体平均時間の推移

文字キー入力間隔平均時間の推移
図7 文字キー入力間隔平均時間の推移

1単語入力平均所要時間の推移
図8 1単語入力平均所要時間の推移

4-3-3.各試行ブロックにおける外れ値出現率

パフォーマンスの指標として,作業時間の平均値や変動以外のほかに突発的な作業の遅れの頻度が考えられる.そこで,課題全体において算出した外れ値を試行ブロックごとに分け,ランダム試行ブロックごとの出現率を分散分析した.

その結果.文字キー入力,次の作業に取り掛かるまでの間隔に置いてランダム1とランダム4にのみ有意傾向が見られたが,キー間隔全体,文字列確認時間では,各試行ブロックでの有意差は見られなかった.

外れ値出現率平均の推移
図9 外れ値出現率平均の推移

4-3-4.各キー入力間隔における外れ値出現率の比較

文字入力間隔,文字列確認時間,次の作業に取り掛かるまでの各入力間隔と各試行ブロックの2要因で分散分析を行った.なお,文字入力間隔については,1単語あたり4回の入力が行われるため,外れ値の出現確率が他と比べて4倍になる.このことを考慮し,文字入力における外れ値を4で除算して分析を行った.

その結果,試行ブロックの主効果(F(3,54)=3.691,p<.01),及びキー入力の主効果(F(2,36)=61.391, p<.01)は共に有意であった.また,各主効果の下位検定を行ったところ,試行ブロックの主効果についてはランダム1とランダム4にのみ有意差(p<.05)が見られた.また,各入力間隔による主効果の下位検定結果については,文字入力と次の作業まで・確認に有意差が見られた(p<.01).これらのことより外れ値出現率の変化は文字列入力間隔よりも,確認時間・次の作業に取り掛かるまでの間隔に顕著に現れると考えられる.

各キー間隔外れ値出現率平均の推移
図10 各キー間隔外れ値出現率平均の推移

4-3-5.エラー単語出現率の分析

エラー率を算出する際に,各キーでのエラー抽出は困難であったため,1単語を基準に正誤判定をした.また,無修正エラーでは個数が少なく,エラー率算出には適さないため,修正の有無に関わらず,単語内にミスタッチキーが1つでも含まれる単語をエラー単語としてカウントした.各課題内でのエラー単語の個数を課題ごとの単語数で除算してエラー率とした.なお,有意味文字列である英単語課題では,制限時間の与え方が異なることからエラーの現れ方に相違が見られると考えられるために,純粋に個数の大小を比較することができない.このため,分析にはランダム試行のみを使用した.

その結果,ランダム4はランダム1に比べ,エラー率が有意に増加していた.

各試行ブロックにおけるエラー単語出現率平均の推移
図11 各試行ブロックにおけるエラー単語出現率平均の推移

5.考察

実験結果から,既存のワークロード評価法は有効に機能していたといえ,ランダム4のワークロードが最も高かったということが確認された.キー入力のパフォーマンスに関しては,英単語課題はランダム課題に比べ顕著に入力間隔が減少していることから,ランダム課題の難易度は高かったと言える.また,ランダム試行内においてもワークロードの高低によるキー入力間隔,外れ値出現確率,エラー単語出現率などに有意な差が見られ,全体の傾向としてはキー入力間隔,外れ値出現確率は減少し,エラー率は増加している.作業パフォーマンスの変化には疲労と習熟による影響も考えられるが,今回の課題において習熟が見られたか否かを断定することは困難であり,仮に習熟や疲労があったとしても,それほど大きな影響は及ぼしていなかったと考えられる.

これらのことより,ワークロードが高いような場合には,被験者の努力による影響によるパフォーマンス変動が見られる可能性が示唆される.その一方で,作業課題に対する習熟によって外れ値が少なくなる可能性もないとは言い切れず,今後の課題実施方法,分析方法について検討をする余地がある.

6.結論

・ワークロードが高い場合にはキー入力時間平均は短くなるが,確認時間,次の作業に取り掛かるまでの時間に変化はない.
・キー入力時間を短くした結果としてエラー率が増加した.
・ワークロードが高い場合にはパフォーマンスの変動(外れ値出現率)が低下する可能性が示唆された.

7.今後の課題

・習熟の効果が否定できないため,習熟の影響を排除できるような実験計画を練る.
・個人によって作業の進め方に違いがある可能性があるので,作業遂行パターンによってグループ化するなどし,より詳細に検討を行う.
・今回の分析では課題2枚ごと(約10分)を1ブロックとして使用したが,より短い課題時間を設定した場合の分析を行う.全体の作業時間や作業量について考慮し,よりワークロードの変化が際立つような作業の実施方法を検討する.
・被験者全員に制限時間を設けて同じ作業・課題量を行わせた場合,個人によって達成量に差が出てくるため,個人のレベルに合わせた難易度,作業時間などを設定する.
・外れ値出現率以外の,パフォーマンスの変動を表す指標の創出を図る.

8.参考文献

1) 大須賀美恵子, 寺下由美, 下野太海, 戸田真美子: ストレス反応の定量的評価法,人間工学, Vol.29, No.6, 353-356, 1993
2) 高野研一, 吉野賢治, 石井敬一郎, 仲佐博裕, 重田定義: 原子力発電所検査監視作業時の生体機能監視技法に関する基礎的検討, 電力中央研究所エネルギー研究所研究報告, No.282005, 1982


SEO [PR] 爆速!無料ブログ 無料ホームページ開設 無料ライブ放送