NTTのAI、センター試験の英語筆記で偏差値64突破 ※一部機械学習では対応できないために辞書を引く方法を採用

1 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 20:58:34.54 ID:MUvvhJIm0

NTTは11月18日、同社で開発したAIに2019年センター試験の英語筆記本試験を解かせ、200点中185点(偏差値64.1)を獲得したと発表した。
同社が16年に行った手法に比べて約90点成績を伸ばした。前回の学びから、さまざまな“試験対策”を施した結果だという。

同社は、NTTグループのAI関連技術「corevo」の研究と、
国立情報学研究所(NII)が主導する「ロボットは東大に入れるか」(東ロボ)プロジェクトの一環として、
センター試験の英語筆記本試験にAIで挑んだ。過去3年分の本試験と追試験でも、偏差値60以上を安定して上回ったという。
16年に行った模擬試験では200点中95点(偏差値55.5)にとどまっており、前回から大幅に点数を伸ばした

今回、センターの英語試験で採用されている問題形式である「不要文除去」「段落タイトル付与」「発音問題」に、
NTTのコミュニケーション科学基礎研究所(CS研)を中心とする東ロボ英語チームが開発した独自技術を適用して点数向上を図った。
CS研は自然言語処理の研究開発を行う部門だ。

文章の中から文脈上必要ない一文を見つける「不要分除去」問題では、一般的な文章に不要な文がないことから、
学習に使うデータを集めるのが難しいという問題があった。
従来のアプローチでは、17~19年の試験で出題された15問中6問のみの正解にとどまるなど、十分な精度が出せなかったという。

東ロボ英語チームでは、普通の文章を基に文章の順番を組み替えた不自然な文章を作ることで、不要分除去問題を自動生成した。
この問題を用いてAIに学習させたところ、15問全てに正しく答えることができた。

段落の適切なタイトルを選ぶ「段落タイトル付与」問題では、問題の構造が特殊なため、既存の自然言語処理技術が使えないという。
同チームは段落と選択肢の近似率を計算して適切な選択肢を選ぶ方法を考えた。これにより、17~19年に出題された5問について全問正解できるようになった。

与えられた単語の正しい読み方を問う「発音問題」は、辞書に載っている正しい発音を基に答える必要があるため、
機械学習による自然言語処理技術では対応できないという。

同チームは、機械学習を使わずに辞書を引く方法を採用。ほぼ満点の成績が取れるようになった。

NTTは今後、図やグラフなど言語以外の情報や一般常識が必要な問題を解くための研究を進める。
東ロボプロジェクトでの取り組みを生かして技術開発を行い、さまざまなサービスに展開するとしている。

NIIが主導する「ロボットは東大に入れるか」プロジェクトは2011年に立ち上がった。
大学入試問題を解くことでAIの性能を客観的に測ることが目的で、21年春までに東京大学の入試を突破できるAIを開発するとしていた。
しかし、16年には「AIにとって難しい『意味を理解する』という分野を突き詰めようとすると、
莫大な時間とコストが掛かる」として、東大合格を断念する方針を発表していた。

https://headlines.yahoo.co.jp/hl?a=20191118-00000074-zdn_n-sci

2 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 20:58:58.83 ID:lh9Ce2pF0
意味あんの?
3 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:00:33.27 ID:PDraREYf0
カンニング
4 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:00:58.16 ID:KgCiAuUw0
AIは辞書持ち込みOKとか卑怯だろ
5 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:01:05.37 ID:bt0F42RR0
ジャップってまだこんな実のない研究やってんの?
海外はとっくにアウトプットフェーズだぞ
6 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:01:11.29 ID:jQdu1bBP0
AIって実はまだ何もできないんじゃ…
7 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:02:02.97 ID:ZSXrjVQi0
まぁこんなのは暗記問題だからな
機械学習意味ねえわ
8 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:02:38.80 ID:N8Z5hILE0
AIが高得点取れるってことは記憶力ゲーってことだろ
国語突破したのか
22 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:23:54.40 ID:9ulIkLaA0
>>8
センター国語なんて答え全部本文に書いてあんだからむしろaiにとっては楽勝だべ
25 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:32:54.84 ID:iLeWzApK0
>>22

> センター国語なんて答え全部本文に書いてあんだからむしろaiにとっては楽勝だべ

これできる人うらやましかった
本好きなのに

9 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:03:50.34 ID:FXjaRKXR0
新井とかいうおばさんはまだこれに関わってるの?
10 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:07:27.22 ID:LYWOw5KPM
NTTの研究所なんて
やってる感で食ってる奴らだけだから
持株のジイさんを気持ち良くさせるだけの仕事
15 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:14:12.10 ID:lJdKveES0
>>10
NTTが研究で強いのは通信の基礎分野
ソフトウェア工学の研究は20年以上まえに関連会社作って独自採算で生き残ってねってやったけど
パットしていない
26 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:40:24.68 ID:rFmbfhXj0
>>15
ぱっとしてないどころか退職ブログ書く輩が続出して話題になったね。コネで閉塞的な組織の話や、唐突に欲しいものリストあげる奴もいたり。
UNIX畑もベーマガ畑もいるけど、みかかのチャリンチャリンビジネスはそうそうは作れないよね。
11 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:08:28.45 ID:VDaGKGIbM
小手先のパラメータいじって最適化してるだけで何も意味ないんじゃね
12 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:09:57.36 ID:FerYPJNs0
同じく試験問題を何回も解いたら普通の人でもそれくらい取れるだろ
内容覚えるし
13 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:11:21.38 ID:9MFlR2uaM
Googleがやったら簡単に満点取りそう
14 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:12:09.18 ID:lJdKveES0
だっさ、俺の母校の落ちこぼれレベルやん
すなわち俺と同等レベル
16 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:15:11.09 ID:FIaMgJnUa
はあ
17 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:19:59.79 ID:001yYZXI0
センター程度の英語で点取れない理由なんて単語や発音が分からないからだし
試験中に辞書与えりゃほとんどの人は高得点取れるだろ
19 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:21:49.26 ID:9ulIkLaA0
>>17
辞書ひいてたら時間たりんは
20 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:22:40.48 ID:p+wob0B80
>>19
そういう部分はメモリ内に辞書展開して一瞬で検索終わるPCの方が強いぞ
28 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:43:20.79 ID:BNOyCaRj0
>>20
辞書は試験中にキーボード入力とする
さすがに事前に辞書インストールは駄目だろ
30 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 22:26:57.87 ID:p+wob0B80
>>28
そういう部分って"学習させる"部分じゃなくて初めから入れとくものじゃないの
18 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:21:22.51 ID:9ulIkLaA0
aiに辞書機能くらい組み込まれてて当然でしょ
aiなめんな
21 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:23:03.61 ID:4Blx5gSv0
いつまで経っても受験受験受験(笑)
だからGoogleに研究員引き抜かれんだよw
23 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:24:29.73 ID:kNbnjdcja
結果的にAIの性能が上がるよりもガラパゴス受験専用のAIの完成度が高まるだけなんだろうな
24 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:29:38.18 ID:rFmbfhXj0
グループ連結30万人のネイティブか高学歴者かTOEIC満点レベルのやつのメーリングリスト作って問題メールしたらリアルタイム満点装置作れてAI不要。
27 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 21:42:45.20 ID:qSGq2ZtHa
AIなんだから満点取れてようやく及第点だよ
29 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 22:25:44.29 ID:y6nnsgvM0
カンニングクソワロタ
31 名前:ひみつの名無しさん 投稿日時:2019/11/19(火) 22:27:38.08 ID:o0xzSxBM0
辞書はダメだろ・・・

コメント

タイトルとURLをコピーしました