TOEIC

TOEICの配点とスコア算出方法とは!?単純な素点処理ではない複雑な仕組みとその解釈方法を分かりやすく丁寧に解説します!【要は偏差値と一緒】

TOEICという英語の試験があります。

国際的なコミュニケーションの場で必要とされる英語能力を評価する民間資格です。試験内容は全200問で、リスニングが45分で100問、リーディングが75分で100問の合計2時間で解き切るマーク式の試験です。

TOEICは、社会人の『ビジネスに特化した英語力』を公平に測定する指標として非常に人気があり、企業にお勤めのビジネスマンは勿論のこと、現在では、下は高校生から上は大企業の部長まで受験する英語資格になっています。

TOEICは、合格不合格で判断される単純な試験ではなく、自身の英語力に基づいて10点~990点の間でスコアが出るようになっています。分かりやすく言うと、ボーリングのスコアのような感じで、英語力が高い(ボーリングが上手い)人ほど高得点が出る仕組みになっています。

しかし、世の中の多くの人はTOEICにおけるスコアの算出方法について知りません。単純に正解数で得点が決まると思っている人もいますが、そんな単純な話ではありません。TOEICは『英語資格』としての信頼性を上げるために、独自に調査研究や統計分析の専門家を抱えており、彼らが各テストの制作・実施ごとに厳正なチェックを行うことによって評価の一貫性・整合性が保たれています。

TOEICはどのようにスコアを出しているのかな・・・?単純に正解数だけで判断している感じでは無さそうだけど、その仕組みがについて学んでみたいなぁ。

本記事では、こんな疑問にお答えしていきます。

今回は、あまり知られていない『TOEICの複雑な統計処理を用いるスコアの算出方法とその解釈方法』について共有していきたいと思います。

TOEICのスコア算出に至るまでの問題開発プロセス

引用元:TOEIC公式サイト

TOEICのスコア算出に至るまでには、多くのプロセスが存在します。これだけ多くの受験者がテストを受け、その英語力を公平に評価するためには、まずは問題が良質なものでなければなりません。

実際にどのようにしてTOEICの問題が作られているのかを見てみましょう。

問題の素案作成

まずは、問題の起案から始まります。テストを作っているのは米国のETSと呼ばれる機関で、TOEFLもここが作っていることは有名です。テスト開発担当の内部スタッフと『アイテムライター』と呼ばれる外部のスタッフによって問題を作成します。

問題作成者であるETSには、しっかりとした問題作成理念と呼ばれるものが存在します。

引用元:TOEIC公式サイト

ポイント

①Reliability(信頼性)

何度受験しても、つねに同じ基準に基づいた評価結果になっているか

②Validity(妥当性)

そのテストが測ると定義している受験者の特長、特性、知識、スキルを定義通りに測定できているか

③Fairness(公平性)

特定の言語や問題内容によっていかなる受験者も有利・不利になるようなことがないか

これによりETSでは、テストそのものはもちろん、その実施方法やスコアの報告の仕方に至るまで厳しいガイドラインが設けられています。

さて、この『アイテムライター』というのは,会社で言うところの監査役のようなもので、様々な国で英語を外国語として教えた経験や、海外で在住あるいは仕事をした経験を持つ人などで構成されています。まずは内部の人間がチェックして、それから第三者機関によってチェックされるという仕組みです。

テストアセンブル

問題の素案が出揃ったら、実際の問題形式に仕上げる『テストアセンブル』という作業が行われます。『assemble』はTOEICでも頻出単語ですが、『組み立てる』という意味を持ちます。従って、素案を実際の問題形式へと組み立てる作業が行われます。これを担当するのはETSのスタッフで、彼らのことを『テストアセンブラー』と呼びます。

レビュー

テストアセンブラーによる問題が出来上がったら、当該問題に対して正しい答えが一つであるか、使われている語句が適切か、曖昧でないかなど、さまざまな角度からチェックされます。また、扱われている内容的にもここでチェックされます。

TOEICは上司の悪口は一切なく、性差別もありませんし、倒産もありません。また、宗教の話もありません。このような不適切な内容があったら排除される仕組みになっているのです。一般的にセンシティレビューと呼ばれています。

TOEICは、特定の国・地域独自の言い回しや文化的背景への理解がなければ解答できないような問題は出題されず、世界共通語としての英語能力を公平に評価できるよう配慮されているのです。

このように、幾度にもおよぶチェックや検証のプロセスを経ることで問題の精度を高めています。

TOEICのスコア算出方法

このように、TOEICの問題は事前にしっかりとチェック・校正がなされた上で公開されます。

ここからが今回の本題です。

『では、スコアはどうやって算出されるの?』

このように考えた方もいらっしゃるでしょう。まずは、TOEICの配点について考えてみることからはじめましょう。

TOEICは冒頭でもお伝えした通り、『リスニング100問』&『リーディング100問』で構成されており、最低点が10点で最高点が990点となっています。ここで重要なことは、満点が1000点ではなく、なぜか『990点』であるということです。配点が1問5点とすると、0~1000点の間のスコアが得られるはずですが、実際はそうはなっていないのです。

このことから、TOEICが単純な素点処理(raw score)で点数を出しているのではないということが分かります。実際は、素点を元に『項目応答理論』というものを用いて各問題フォームを等化し、点数を変換しています。なぜ素点をスコアとしないのかということを良く聞かれますが、理由はいくつかあると考えられます。

理由① TOEICには複数のフォームがある

まず、TOEICの問題には種類があるという事実です。

TOEICの配点とスコア算出方法とは!?単純な素点処理ではない複雑な仕組みとその解釈方法を分かりやすく丁寧に解説します!【要は偏差値と一緒】

TOEICという英語の試験があります。 国際的なコミュニケーションの場で必要とされる英語能力を評価する民間資格です。試験内容は全2 ...

TOEICには問題フォームと呼ばれるものが存在し、数種類の問題を会場ごとに使い分けてテストを行っています。従って、友達と一緒に同じ回を受験したが、会場が違ったために問題が異なったということはよくある話です。

TOEICのスコアは上記でも述べた通り、内容や難易度ができるだけ同じになるように作成されてはいるものの、この『フォーム間』で多少の違いは出てしまうのです。仮に素点で処理した場合、その難易度の違いが直接的にスコアに反映されてしまうため、正確なスコアの算出ができなくなってしまうのです。

理由② 当てずっぽうでの正解を防ぐ

次に、TOEICが択一式の試験(マーク式)であり、記述・論文式の試験では無いということが挙げられるでしょう。TOEICの問題形式が択一である以上、でたらめに解答を行っても確率的には4分の1は正解できます。従って、200問中50問は正解できることになります。

TOEICは990点満点ですから、およそ250点分は正解になるのです。多肢選択式の試験の場合、問題を見ずに適当に解答用紙に印をつけたとしても、一定数の正解を得ることができます。この時得られる正解数をテスティングの専門用語では『Chance Score』と呼ぶわけですが、このチャンススコアを素点で処理してしまうと、正確な英語力を把握することができなくなります。

これは本来の趣旨から外れてしまう為、特別な換算を用いてスコアを出します。このことにより、例え確率的に4分の1正解したとしても250点取れるかというとそうではなく、4分の1の250点どころか、もっと低くなってしまいます。

TOEICのスコア算出方法で重要な『項目応答理論』とは!?

TOEICは、テストを実施した後も、『意図に沿った問題だったか』『難易度は適切であったか』といったことを確認するために、受験者の解答データを活用してチェックをしています。

テスト問題における妥当性の評価方法にはいくつかありますが、上記でも述べたように、TOEICにおいては、項目応答理論(IRT:Item Response Theory)と呼ばれる品質の評価手法を用いています。『項目(Item)』というのは試験を構成する1つ1つの問題のことを意味し、『応答(Response)』はその項目に正答するか誤答するかという状況を意味します。

要するに、項目応答理論とは、項目の特性(難易度・識別力)が判明している場合において、その項目に対する反応(解答状況)を用いて、試験の結果から測定できる能力を推測するものだということです。何もTOEICに限らず、大規模な試験の項目作成・実施・評価・運用のための優れた実践モデルとして世界的に定着しているのが項目応答理論です。

引用元:富士通ラーニングメディア

この図において、理想的な問題は一番左のようになります。理解度(正確にいうと能力)が低ければ低いほど正解率は減少し、逆に高ければ高いほど正答率が1に近付くというものです。

逆に真ん中のグラフでは、能力が無くでもある程度正解できる、いわば『簡単な問題』『差がつかない問題』であるということが分かります。TOEICでは、このような問題を落とすとスコアは低くなります。一番右のグラフは、基本的に能力と正答率が関係無い(判別ができない)問題であるということになります。

もしここで、S字の形から大幅にそれて直線に近い形であったり、逆S字になっているような曲線になる問題は能力差を適切に測定できない問題であるということが分かります。ということは、この問題の配点をいじらないと正確にスコア算出ができないことになります。

項目応答理論に関しては、アカデミックな内容になるため、インターネット上に大量の文献が存在します。詳しく知りたいかたは検索してみると良いかもしれません。

TOEICのスコア算出における『等化』

さて、このような理論を踏まえた上で、TOEICでは『等化』と呼ばれることをします。等価というのは、同一の能力を測定したいテストにおいて、複数の問題フォームが存在する場合に、相互に比較可能な得点で表すことができる共通の尺度を作成することです。

イクエイティング

ETSがテスト開発で長年培ってきたノウハウが詰まっているのが、『イクエイティング(スコアの同一化)』といえます。

TOEIC Programでは、素点で最終評価を下すのではなく、素点を換算点に置き換えて最終的なスコアを算出します。その方法は、新しいテストを作成する際に、以前に実施した問題のごく一部を必ず新しい問題の中に織り込み、スコア算出時に新旧テストを比較し、難易度によってスコアにブレが生じないように調整。スコア基準の不変性を確保しています。

したがって受験者は、実力が変わらなければスコアも一定となり、また時系列的に学習到達度を確認することもできます。

等化を用いるのはTOEICだけではありません。例えば、日弁連法務研究財団でも解説されています。

等化とは、同一の仕様(specification)に基づいて開発されるが、問題項目の内容が異なる複数の版が存在するテストにおいて、どの版を受験してもテストの結果が共通の尺度上の得点で表現され、異なる版の受験者間で得点を相互に比較することを可能にする統計的操作のことをいいます。同一の仕様とは、測定する能力、問題の種類、問題の形式、テスト時間などが等しくなるように設計されているということです。

引用元:公益財団法人日弁連法務研究財団

このように、TOEICに限らずともテストの等化は行われているのです。等化をすることによって難易度を調節し、同じ尺度でスコアを解釈できるようになるのです。

具体的にはどのように行うのでしょうか。

①複数のフォームに共通項を挿入

受験者は複数のフォームを受けるわけですが、全く別の問題を受けるということはありません。フォームは違っても、共通している問題があります。分かりやすく例えると、ベン図のような感じです。

ベン図自体は高校で『数学A』という科目における『集合』という分野で習うはずです。

ショーン
数学Aって今もあるのかな・・・数Cは無くなったよね・・

まずは、ベン図のように共通項を作って、全く同じ問題を解かせます。ベン図を知らない方のために言っておくと、真ん中の重なり合っているところを共通項と言います。

②共通項の正答率を算出

例えば、ある回がAというフォームとBというフォームで開催されたとします。ここでは100点満点とし、共通項が30点満点であると仮定しましょう。

受験者 フォームA フォームB 共通項 能力
Xさん ??? 15点 50% 低い
Yさん 70点 18点 60% 高い

さて、この時受験しているフォームが違うので、単純にスコア算出をすることはできません。そこでまずは共通項を見てみましょう。

共通項では、30点満点のところ、甲は15点なのに対し乙は18点です。母体のサンプル数が多ければ多いほどこの差は正確になってきます。ここで、乙は甲よりも10%高い点数を取るといえます。

③フォームの難易度を推定

それでは、上記の表において、甲がフォームBを受験していたらどうなったか、乙がフォームAを受験していたらどうなったかを換算します。

やり方は至って簡単です。共通項において、乙は甲よりも10%高い正解率を出していたので、共通項でない他の問題においても10%高い点数を取るだろうと仮定するのです。従って、乙はフォームAでは62+10=72点取るのではないかという推測ができるのです。逆に、甲がフォームBを受験したら10点低い60点だろう、ということになります。

以上より、受験者乙で考えれば、フォームAでは72点となり、フォームBよりも2点高い(簡単)ということになります。これによって難易度が推定できるので、それに対応したスコア換算表を作って算出するのです。

TOEICでは誤差は必ず発生する

簡単に説明すると、TOEICのスコア算出の仕組みは以上になります。ただ、一般的にテストには誤差がつきものです。そもそも我々受験生も勘で解答する問題や、上記で説明したチャンススコアが存在する以上、100%正解にスコア算出をすることは不可能といって良いでしょう。

測定の標準誤差という概念があります。これは、TOEICのスコア算出におけるスコアのばらつきの程度を意味します。一般的にTOEICでは、統計データ上、各パートでそれぞれ+-25、合計+-50の誤差があると言われています。

ただ、私の体感的な話で恐縮ですが、100点以上は普通に差があると思われる回も何度か遭遇します。

ショーン
これ本当に正確なのかなー。

重要なことは『1回1回のスコアに一喜一憂しない』ということでしょう。結構上下することもあるので、その度に落ち込んだり喜んでいたりしていてはいけません。

仮に絶対に超えなければいけないスコアが存在するのであれば、毎回受験すべきだと口を酸っぱくして言っているのはこのような意味があるのです。

数打ちゃ当たるではないですが、TOEICは絶対評価の素点処理ではなく、相対評価によるスコア算出方法を用いている以上、受験回数を増やすことがスコアアップの秘訣の1つであると言えます。本当は50点以上高いスコアが取れたはずなのに実際の実力より低い数字が出てしまっていたら、あまりにももったいないからです。

このように、『誤差は必ず発生する』ということを知っておくだけでも精神的な余裕が生まれます。

まとめ

いかがでしたでしょうか。

今回は『TOEICの配点とスコアの算出方法とは!?単純な素点処理ではない複雑な仕組みとその解釈方法を分かりやすく丁寧に解説します【要は偏差値と一緒】』というテーマでお話しをしました。

TOEICでは、テストの妥当性や信頼性を保つために、採点及びそのスコア算出において細かい分析・検証作業が行われています。一応、採点前にもサンプルが無作為に抽出され、その解答率を元に不適切な問題は除外されていますが、それでも一定数の誤差は発生します。

TOEICのスコア算出の仕組みは単純なものでは無いということを分かって頂けたでしょうか。

単純な素点処理ではないということを知っておくだけでも、精神的には違うと思います。要は偏差値的なものであり、簡単な回では、周りの人間も当たり前のように正解してくるので、スコアが低く出る可能性が高いということです。

このことを肝に命じておけば、誤差に惑わされずにコツコツと努力することができると感じています。

TOEICの配点とスコアの算出方法にまつわるお話でした。

最後までお読み頂き、ありがとうございました。

一生モノの英語力を身につけたい方へ

(30日間全額返金保証制度あり)

スタディサプリTOEIC対策コースが今だけ1週間無料で体験できます。

もう場所を選ばずに英語を学習する時代だよ!
ショーン

・新しい参考書をすぐ購入してしまう
・購入しても参考書を放置
・効果が出ないのは参考書のせい
・もっと効率よく学習したい
・本気でスコアアップしたい

このまま勉強しても、あなたは目標スコアを一生達成できません。

自分の学習法を信じられないと、いくら勉強してもスコアアップはあり得ません。

もしあなたが本気でスコアアップを目指すのであれば、スタディサプリTOEIC対策コースを使ってください。

ショーン
今だけ無料で使える!

公式スタディサプリ ENGLISH まずは無料体験!

【注意】キャンペーンには先着順です。

 

この記事はいかがでしたか?

  • この記事を書いた人
  • 最新記事

ショーン

EARTHIANS(アーシアンズ)では、英語や勉強全般に関する日々多彩な情報を提供しています。現代のグローバル社会で生き残る『サバイバルツール』としての英語学習方法を発信中。大学受験生指導経験有り。【経歴】ドルトンスクール→私立中学(全額特待)→県立高校→私大法学部→航空業界【実績】TOEIC330→880(550up)達成。その他航空無線通信士/英検準1級/国連英検B級等

-TOEIC

© 2021 EARTHIANS(アーシアンズ)