FF10の話(8) – FFⅧ・その3 声のないゲームの問題

またまた期間が開いてしまったのだけど、夏コミまでには終わらせて、夏コミでは本にしたいと思っていたりする。
というわけで、FF10の話を書くシリーズの第8回。
シリーズは以下。
FF10の話(1) - それは1991年から始まった
FF10の話(2) - ヘラクレスの栄光Ⅲの衝撃
FF10の話(3) - ファイナルファンタジーⅦ・その1
FF10の話(4) - ファイナルファンタジーⅦ・その2
FF10の話(5) - ファイナルファンタジーⅦ・その3(終)
FF10の話(6) - ファイナルファンタジーⅧ・その1
FF10の話(7) - ファイナルファンタジーⅧ・その2
本編に入る前に簡単な注意。
このシリーズは『FFⅦ・Ⅷ・Ⅹ』について、もう超ネタバレのレベルで話が進んでいる。だからプレイしたことがなくて、そしてプレイする予定がある人は、ここから先はあまり読まないことをオススメしておきたい。
前回、FF8のストーリー構造について説明して「出来は良かったと思う」という話を書いたわけだけど、反面、評価が高いゲームではなかったという話も書いた。
そして最後で

また、FF8では「声がない」という問題が、とても大きくなり始めたシリーズでもあったのが、それが評価が高くならない理由になりはじめていた…と思うのだけど、それについては次回で。

と、書いたけれど、どうしてこれが問題になっていたのかを書く前に、少しまずゲーム内のボイスの話を書いておきたい。


ゲームの世界で潤沢に音声が使えるようになったのは1988年ごろに光学メディアCDROMが登場してからとなる。
このあと音声はCDROMやDVDROMの独壇場だったのだけど、2000年代に入り飛躍的に容量を増やした半導体メモリが最初にCDROMを抜き、2009年ごろからは普通にDVDより容量の大きなゲームがROMでも発売され、ROMでも普通にフルボイスのゲームが制作可能になるのだけど、それはともかくとして、ともかく音声って奴は容量を食う
どれぐらい食うのかというと…
ゲームの世界でほぼ史上初の近代的フルボイスゲームは、あの『ときめきメモリアル』(1994/PCエンジン)だけど、PCエンジン程度のADPCMで、もうCDROMの容量としてはすりきりいっぱいになっていた。
もちろん、今で言うプリレンダのムービーなんて1秒も入ってない。
歴史的に見ると、ある一定以上のテキスト量があるゲームをフルボイスにしようとすると、CDROMはPCエンジン程度のオーディオクオリティですら、容量ギリギリだったのが事実で、1994年のPS1発売時には、CDROMはフルボイスのゲームを作ることを考えると、容量に余裕があるメディアではなくなっていたのが事実だったのだ。
これはフルボイスのゲームを作ると考えると当たり前の話だった。
CDROMのCDDAと呼ばれるオーディオデータはROMの容量に換算すると、約1秒150キロバイトを消費する。対して、当時のPCエンジンのADPCMは1秒8キロバイト。圧縮比で約20倍程度。初期のCDROMの容量は約60分程度だから約20倍の圧縮率。60*20で、一枚のCDに1200分、20時間程度の音声が録音できることになる。
そしてゲームのプレイタイムを一回8時間と設定した時、フルボイスなら一度のプレイで数時間分の音声を消費するわけで、数回のプレイに耐える設計にすれば、たちまち十数時間ぶんという話になり、あっというまにいっぱいになってしまう。

最初に例に出した『ときめきメモリアル』の場合、ヒロイン13人がいるので、一人あたりの収録可能音声量は1時間弱しかないことになる。そう考えると音声がどれだけ容量に決定的な影響を与えるか想像がつくだろう。

そしてこれはPS1やサターンではさらに深刻な問題になった。
なんせオーディオもグラフィックもPCエンジンより容量を食ったのに加えて、ムービーまで入ってくる。これでサイズが膨らまないわけがない。
例えばipodなんかで鳴らせる音の中ではショボい方に入る128Kで入れたとして、これがだいたい10:1程度の圧縮率。CD1枚で10時間ぐらいって話になり、PCエンジンより遥かに厳しくなる。
だから『ときめきメモリアル』はPS1版はなんとか1枚だったけど、続編の『ときめきメモリアル2』ではCDROM5枚組なんてとんでもないことになっている(一枚で収まった大きな理由はPS1の時代にはPCエンジンの時代より数十メガ容量が増えていたのが大きかったのだろうと推測している)。
ここでPS1でのFF7を振り返ると、すでに3枚組。FF8でも3枚組。
仮にボイス入りにしたら、フルボイスでなく主人公級および敵役級だけだっと仮定しても、いったい何枚組になったのか想像もつかない。
つまりCDROM時代のFFでは、理屈の上はともかく、実際的な商品として考えた時、ボイスを入れる容量の余裕はなかったのが事実だったわけだ。
もうひとつの問題点として、FF7-FF8ごろのゲームシーン、つまり96-99年ごろは、まだまだ声やムービーに対して保守的…というか、ケチをつける人が多かった。
前に書いたけれど「RPGはプレイヤー=主人公=主役」の考え方はこの当時は今より遥かに強かった。そして、FFシリーズでプレイヤーキャラクタが結構ベラベラしゃべることに対する批判がまだ強かったのに、声をつければ「イメージと違う」と文句を言われた可能性は遥かに高かったと思う。
おまけに主人公にセリフがあるのにしゃべらなくて、周囲のNPCがしゃべるとどう考えてもバランスは悪い。それなら主人公のセリフがない方がマシってことになるけれど、今度は主人公のセリフを代弁してしゃべるキャラクタが必要になるので、やっぱり大変だ。

主人公のセリフを代弁するってのは「お前が怒ってるのはわかるぜ」とかプレイヤーがシナリオ的に感じてもらいたく、しゃべってほしいことを勝手に代弁するキャラクタ。
また、FFで声が初めてついたのは、まさにこの話の主題になるFF10なのだけど、FF10は発売されるまでは「主人公が喋るなんて」とかかなり批判されていた。
ところで主人公が喋らない事を前提に作られているゲームで、この手の問題をかなりスゴい形で解決しているのが、東京魔人學園で登場した「感情を入力する」ってシステム。実にスゴいシステムなのだけど「はっきりしない曖昧な表現」だから機能しているところもあるので、セリフの代わりに出来るわけではない。あともちろんこれはムービーの中などでは使いにくい。

つまり、ボイスは容量から見れば非現実的だったし、当時のユーザーに望まれているとは言いがたかったということなのだけど、これが問題になったのがムービーだった。
通常のゲーム画面やイベントではテキストでメッセージが流せるが、ムービーでは簡単にはそうはいかない。
いわゆる映画の字幕のようなものを載せる以外に、うまい方法はないって話になるのだけど、PS1時代のハードウェアでムービー画面に字幕を載せるのは結構制限が厳しく、特に高画質の1670万色モードでは不可能に近かった。(全く出来ないわけではないけれど、いろいろな問題を考えると避けたいところだった)。
じゃあ、FF7ではどうしていたのかというと、ほとんどのシーンではセリフなしのムービーで演技し、ごくごく一部で字幕の形でセリフをつける方法をとっていた(具体的にはエンディングなど)。
ではFF8は…というと、実はムービー内でセリフが表示されることは一度もない。
どうしてこうしたのか、理由はさっぱりわからないが、なんにしてもFF8のムービーはキャラクタの演技と音楽と効果音だけで全てを語るシステムになっている。
そして、それがストーリーが曖昧になる、非常に致命的な大問題を引き起こしていた。
どうしてそんなことになるのか?
ムービーはたいていはゲームのなんらかのクライマックス周辺に置かれている、一連の時間で制御される、ユーザーが介入できる範囲が狭い映像シーケンスと定義することが出来る。

ユーザーが介入出来る範囲が狭いというのは、例えばQTEで介入出来るようなゲーム、FF8のようにムービー中である程度動くことができて、完全に同じシーケンスにならないゲームがあるから。

ここでキャラクタがなんらかのセリフを喋れば、状況はとても明らかだけど、FF8ではもちろんボイスがないので、演技だけでストーリーを説明することになるので、ストーリーを理解するのは少々難しい。
しかも、これがホンモノの人間ならまだしも、当時のポリゴンキャラの演技のレベルは間違っても高いとは言いがたい。がんばっているけれど、フェイシャルの動きもまだまだだ。

じゃあ、今は演技レベルは高いのかと言われれば正直、まだまだだと思うけれど。PS4世代になったからといって、人間レベルからははるか遠いのが現実だ。人間レベルの演技が出来るのは、まだ映画クオリティの範囲だと思う。

ただ、これはもう技術の問題でアニメーションとかやってる人の責任ではなかっただろう。実際、FF7でもこういう問題はあったのだけど、FF7のムービーは登場人物の心情を表すようなシーンは珍しいのに加え、FF8と比較してキャラクタが遥かにSDに近いこともあって、オーバーアクションなのもあり、まだしもわかりやすかった。
ところがFF8は人物はリアル頭身で、おまけに結構心情的なところに踏み込んだので、ますますムービーがわかりにくい問題が大きくなったのだけど、なによりマズかったのが、このムービー、カットを見ても何を見てもスペクタクルな映画を意識したもので、そのうえトーキー(つまり声のある映画)の演出なものだった。
結果として、FF8のムービーは「音声トラックの抜けた映画」になってしまっていて、ストーリーを語る道具としては、かなり失格と言わざるを得ないシロモノになっている。
つまりFF8のストーリーは「ムービー前のセリフ」と「ムービー後のセリフ」で「わかりにくいムービーシーンを理解する構造」になっていた、つまり肝心要のクライマックスシーンにフラストレーションが溜まる構造だったわけだ。

ところで、サイレント時代の映画ではセリフがなかったじゃないか…トーキーとそんなに変わらないだろうという人も世の中にはいるかも知れないが、サイレントでは要所でセリフを表示したり、加えて状況説明を入れたり、さらに弁士がいる場合があったりと、声無しでストーリーを説明するために、さまざまな手段が使われていた。
また、今のトーキーに慣れた目でサイレント映画を見ると驚くほどオーバーアクションで、感情表現をわかりやすくしているし、なにより、声がなくても話が通じるように話も単純だ。
実際、チャーリーチャップリンのサイレントの作品を見れば「声がなくても話を通じさせる」ために、非常に丁寧に仕事がされていて、今のトーキーはやはり音があることを前提に作られているのがよく分かる。
そしてサイレント的な技術はドラゴンクエストシリーズの方が良く使っていたのが、真実だったりするのだ。

このフラストレーションの溜まる構造が派手に出たのがエンディングに向かうシーンだった。
時間圧縮が解けた後、なぜうまくスコールが元の時間に戻れなかったのかまでの説明が舌足らずなところにもってきて、スコールが落ちた場所がどこなのかの説明が全くなく、しかも状況をスコールの口から喋らせるとか、他のキャラから喋らせるぐらいしか方法がないのに、セリフがないものだから「どうして、そこにいるのか」わかりにくいこと夥しい。
また、どのようにしてリノアが助けたのかもわからない(魔女の力を使ったということなのだろうが)。
だから、結局、どうしてスコールが時の狭間みたいなところに落ちて、どうしてそこから助けられたか全く分からず、実にいい加減な展開に見えてしまう。

ただ、助けた後のエンディングに至る流れとエンディングのスタッフロールは、今でも大好きだといえるぐらい素晴らしい出来なので、まあプラマイはゼロだと思いたいのだけど…

個人的な意見となるが、この体験、つまり、FF8で残した様々なゲーム的な要素や、ムービーに音声を入れない(入れられない)ことによるわかりにくさ、が、ストーリーに対する説得力を持たせることの難しさとなって、FF10で「音声を入れる」という判断につながっていったのだ…と思っている。
というわけで、ついにFF10、今のところの野島さんの最高傑作のシナリオだと思っている作品に話は入っていくのである。

LinkedIn にシェア
Pocket