論理回路から人工知能への進化を振り返る

コンピュータは論理回路で構成され,機械語で書かれた命令文の入力によって回路が動作する仕組みだ.初期の論理回路は真空管を組み合わせたものだが,半導体技術の進歩によって回路部品はトランジスタから集積回路へと進化した.

コンピュータへの命令文は2進数の機械語で書かれるが,人間は機械語を扱いづらい.そこで人間はプログラミング言語で記述し,通訳を介してコンピュータが理解できる機械語に変換することとした.その通訳がコンパイラやインタプリタである.

コンピュータの動作は人間が指示する命令文を逐次実行するのだが,ニューラルネットワーク (Neural Network) の技術が発展するとあたかもコンピュータが判断して結果を出力するかのような技術へと変貌を遂げた.機械学習 (Machine Learning) によって膨大なデータ (Big Data) を入手し,ニューラルネットワークを深化させたディープラーニング (Deep Learning:深層学習) を通じてコンピュータが演算に使用するパラメータを自ら最適化する人工知能 (AI:Artificial Intelligence) の出現である.

三極真空管ではガラス管の中心部にカソード,そのカソードを取り囲むように置かれたグリッド (網状のシート),そして金属板のプレートがグリッドを取り囲むように配置されている.カソードを加熱すると熱電子が放出され,熱電子が正の電圧を印加されたプレートに到達すれば電流の発生だが,その途中に設置したグリッドに負の電圧を印加すると熱電子の運動が妨げられてプレートに到達する電子数は減少する.

三極真空管が増幅器として機能するのは,グリッドに与える電圧をわずかに変化させるとプレートに到達する電子の数 (流れる電流) が大きく変化するからだ.ラジオは三極真空管の増幅器としての代表的な応用である.イヤホンで小さな音を聴く鉱石ラジオからスピーカーで増幅された音を聴く真空管ラジオへの移行は1920年代にすでに始まっていたのだが,真空管ラジオが普及したのは1930年代以降である.そして,本邦初のラジオ放送の電波が本学の田町キャンパスから送り出されたのは1925年のことであった.

三極真空管をスイッチング素子に応用するには,グリッドに与える電圧の有無による2つの状態がプレートに流れる電流の有無による2つの状態に対応することを利用すればよい.おもに1950年代に開発された真空管式コンピュータは三極真空管のスイッチング素子としての応用であった[1].

トランジスタは三極真空管の動作をn型及びp型半導体の組み合わせで実現した電子デバイスだ[2].三極真空管のプレートをコレクタ,カソードをエミッタ,グリッドをベースに置き換えるとバイポーラトランジスタになる.npn型バイポーラトランジスタの構造は,エミッタとコレクタがn型半導体で,その間にp型半導体で構成された薄いベースが挟まれている[注1].

コレクタに正の電圧を与えると電子はエミッタからコレクタへと向かうが,その間に電子を通過させないベースが存在するためにその流れは阻止される.しかし,ベースに正の電圧を与えると,電子はベースを通り抜けてコレクタに到達するようになる.そしてベースに与える電圧をわずかに変化させるとコレクタへと流れる電流は大きく変化する.この性質を利用したトランジスタは増幅器として三極真空管に置き換わり,真空管ラジオはトランジスタラジオへと進化した.

トランジスタがスイッチング素子としても動作するのは,ベースに与える電圧の有無による2つの状態がコレクタに流れる電流の有無による2つの状態に対応するからだ.トランジスタは1950年代半ばからラジオ用の増幅器およびコンピュータ用のスイッチング素子として利用され,1960年代後半には集積回路が発達して電卓やコンピュータへの応用が進んだ.

コンピュータの技術進歩には微細加工技術による集積回路 (Integrated Circuit) の集積度の向上が大きく寄与した[3, 4].集積回路は多数のトランジスタを埋め込んだ回路だが,そのトランジスタを小型化することで集積度は高められる.集積度を高めるには,フォトリソグラフィ (Photolithography) を応用した微細加工技術の進歩が重要だ.銀塩写真の原理を応用して素子・回路のパターンを半導体ウェハー上に焼き付ける技術である.

トランジスタのようなスイッチング素子を組み合わせると論理回路 (デジタル回路) を構成することができる.それぞれのトランジスタのベースに与える電圧の有無によって,論理回路の出力の有無が決定される回路である.論理回路にはAND回路,NAND回路,NOT回路,OR回路,NOR回路,Exclusive OR回路,Exclusive NOR回路の7つの要素回路がある[5].このなかでNAND回路が最も重要な回路とされるのは,安価なNAND回路を組み合わせると他の6つの要素回路を構成できるからだ.そして複雑なデジタル回路は単純な要素回路の組み合わせで構成される.電卓は初期のデジタル回路の代表的な応用だ[6].

論理回路は0と1からなる2進数 (機械語) の世界だ.2進法では1桁の数字 (1ビット) では0と1の2種類しか表せないが,2桁 (2ビット) ならば4種類 (22),3桁 (3ビット) ならば8種類 (23),4桁 (4ビット) ならば16種類 (24),そして8ビットだと28 = 256種類を表せる.4ビットの16種類については,10種類の数字 (0123456789) と6種類のアルファベット (ABCDEF) を組み合わせた16進数で表示することも可能だ.そしてデジタルデータの大きさを表す単位であるバイトについては,1バイト (Byte) = 8ビットの関係にある[注2].

マイクロプロセッサ (Microprocessor) はパソコンの心臓部にあたる中央演算処理装置 (CPU:Central Processing Unit) などに使用する集積回路である[7, 8, 9].1971年には4ビットのデータ処理が一度にできるインテル社のマイクロプロセッサ4004が発表され,1972年には8ビットのデータ処理が一度にできる8008が開発された.マイクロプロセッサ4004が初めて搭載された製品はビジコン社のプリンタ付き電子式卓上計算機 (141-PF) である.4ビットのマイクロプロセッサは電卓用に開発された論理回路だったのだ.

8ビットのマイクロプロセッサは黎明期のパソコン (Personal Computer) に搭載され,1980年代前半には16ビットのデータ処理ができるマイクロプロセッサのパソコンへの応用が進んだ.現在の主流である64ビットシステムのパソコンは264個のデータ処理が一度に可能となるから,64ビットシステムのCPUの処理能力は,一世代前の32ビットシステムの232倍に達する.

コンピュータプログラムは2進数の機械語で記述することが基本だ.機械語は機械にはやさしいが人間には扱いづらい.そこで人間にもやさしいアセンブリ言語 (低水準言語) が開発された.アセンブリ言語は人間にも比較的読みやすく,機械語へ変換することも容易だ.アセンブリ言語をさらに人間にも読みやすいように進化させたものがプログラミング言語 (高水準言語) だが,機械が容易に理解できるような言語ではない.

C言語やJavaなどを含む高水準言語は人間にやさしいプログラミング言語だが,それを機械が理解できるように翻訳する必要がある.この役割を担うのがコンパイラやインタプリタといったプログラミング言語処理系だ.コンパイラは人間が書いたプログラム (ソースコード) をコンピュータが理解できる形式 (機械語) にあらかじめ変換してから実行する方式で,インタプリタは人間が書いたソースコードをコンピュータが実行する際に1行ずつ機械語に翻訳していきながらプログラムを実行する方式だ.

FORTRANは1957年に開発された数値計算に特化したプログラミング言語だ.使用するプラットフォームによって適切なコンパイラを選び,機械語で記述されたファイルに変換してから計算を実行する[注3].COBOLは1959年に誕生した汎用系プログラミング言語で事務処理に用いられる.BASICは1964年に開発された初心者向けのプログラミング言語で,さまざまなバリエーションがあるが,いずれもFORTRANに似た形式のインタプリタ型言語で,1970年代から80年代にかけてのパソコンの萌芽期にはあまねく使用された.これらのプログラミング言語では,順番通りに書かれた命令文をそのままの順序でコンピュータは実行する.

コンピュータの黎明期に開発されたこれらのプログラミング言語は現在の主流ではない.インターネット環境に適合する新たな言語が次々と登場したからだ.1972年に登場したC言語は,後発のC++ (1983年登場) やJava (1995年登場),C# (2000年登場) などとともにWebサービスのアプリケーション開発に用いられるコンパイラ型言語だ.1991年に開発されたインタプリタ型言語であるPythonは Webサービスの開発に加えて人工知能の開発にも利用されている.1993年に公開されたHTMLと1995年に開発されたPHPは Webサイトの構築に利用され,1994年に開発されたスタイルシート言語であるCSS,1995年に開発されたJavaScriptとともにWebシステムの中核技術の一つとなっている.人間はさまざまなプログラミング言語を駆使するが,コンピュータはその装置に固有の機械語の指示によってのみ動作する.

パソコンやスマホ (スマートフォン) だけでなく,電卓とワープロ専用機もデジタル回路を応用した製品だ.電卓が身近な存在になったのは1970年代だ.高価な電子式卓上計算機が小型化して持ち運び可能となり,手頃な価格で提供できるようになったからだ.加減乗除に限定されていたものから三角関数や対数なども利用可能な関数電卓へと機能も拡張され,プログラムが可能な電卓も登場した.初期の電卓の多くは蛍光表示管を表示部に使用していたが,その後の電卓に液晶ディスプレイが普及したのはその応答性と耐久性が格段に改良されたからだ[10, 11, 12].

タイプライターの始まりは手動式で,キーを叩くとそれに接続されたタイプアームの先端に取り付けられた活字がインクリボンを介して紙を叩き,紙に活字が印字される仕組みだ.手動式はその後,電動式に進化してタイプアームはタイプボールに置き換わったが,活字がインクリボンを介して紙を叩いて印字する仕組みは不変である.タイプライターは文字の種類が少ない欧文には向いているが,膨大な種類の漢字を取り扱う和文には無理がある.和文タイプライターはその無理を貫いて開発されたので操作性に難があった.

ワープロ専用機が1980年代半ばから急速に普及したのは,和文タイプライターのように膨大な種類の活字を用意する必要はなく,キーボードからローマ字入力してそれを漢字に変換すると漢字混じりの文章が作成されるからだ[13, 14, 15].それを専用機と一体化されたプリンタ (インクリボンに熱を加えてインクを紙に転写する活字不要の熱転写方式が主流であった) で出力すると,清書した印刷文書を即座に作成できることは画期的な進歩であった.しかし,1990年代になると専用機は衰退の一途を辿りパソコンが躍進した.プリンタと一体化されたワープロ専用機のコストパフォーマンスと信頼性は高かったのだが,パソコンはさまざまなアプリケーションが利用可能でインターネット接続も可能といった利便性がそれを凌いだためだ.

プログラミング言語のBASICを内蔵した個人向けのコンピュータが普及したのは1980年頃からだ[注4].1975年にMITS (Micro Instrumentation and Telemetry Systems) から発売されたAltair 8800はCPUにインテル8080を搭載した世界初の個人向けコンピュータである.そして1977年にはTandy CorporationのTRS-80 Model I,Commodore社のPET 2001,Apple社のApple IIなどが発売され,1978年にはシャープのMZ-80Kが,1979年にはNECからPC-8001が発売された.いずれも8ビットCPUを搭載し,ROM (Read Only Memory:読み出し専用の不揮発性メモリ) に格納されたBASICインタプリタによってプログラミング言語のBASICが作動する仕組みである.

オペレーティングシステム (OS) にMS-DOS (Microsoft Disk Operating System) を採用した16ビットパソコンPC-9801が1982年に発売された.16ビットCPUの登場によって日本語処理は大幅に改善され,MS-DOS対応のアプリケーションであるワープロの一太郎 (1985年発売) と図形ソフトの花子 (1987年発売) は一世を風靡した.BASICでプログラムを自作する時代から既存のアプリケーションを活用する時代への扉が開かれたのだ.

1990年頃からは複数のアプリケーションを同時に操作するマルチウィンドウのOSが普及し,キーボード入力に加えて付属のマウスでの直観的な操作が可能なマッキントッシュ (Macintosh) が人気を集めた[16, 17].現在のMicrosoft WindowsやmacOSといったパソコンのOSに採用されている基本的な構成がこのときに完成したのだ.

パソコンに搭載されるアプリケーションはさまざまだ.Excelに代表される表計算ソフト,文書作成のワープロソフト,プレゼンテーション用のソフトウェア (PowerPoint) に加え,画像の加工ソフトやゲームソフトに至るまで夥しい数のアプリケーションが組み込まれている.そしてインターネットを通じた文字情報,音声情報そして画像・動画情報の送受信が可能となると,Webサイトを閲覧するプラウザや電子メールを送受信するソフトウェアも組み込まれるようになった.

近距離の送受信が可能なトランシーバーは無線電波を利用する.固定電話は有線の公衆交換電話網に接続して遠距離の送受信が可能だ.これらの機能を組み合わせた自動車電話は無線電波で公衆交換電話網と相互接続されるシステムだ.ポータブル電話機は重い自動車電話が小型化されて持ち運び可能となったもので,小型化がさらに進んで携帯電話の段階にまで達すると急速に普及が広まった.

携帯電話に文字の送受信機能や写真撮影と画像の送受信機能等が付加され,インターネットへの接続も可能となってスマホが誕生した.スマホが発達すると,パソコンの機能の一部がスマホに移行しただけでなく,持ち運び可能な小型コンピュータとしての特性を生かしたさまざまな機能が追加された.現在のスマホには電話やカメラの機能だけでなく,ゲームソフトやキャシュレス決算を始めとするさまざまなアプリケーションが搭載されている.

文字情報の送受信技術は,従来の手紙や書籍の機能をパソコンやスマホの画面で実現することを可能とした.音声情報の送受信技術はレコードやCD等による音声記録媒体の機能をパソコンやスマホで実現したのみならず,電話線不要 (初期のインターネットには電話回線が利用されたが,現在では光回線が普及して電話も光回線経由が主流になった) の音声通信を実現した.そして画像や動画の送受信によってインターネットはファクシミリやテレビおよびテレビ電話の機能も持つように進化した.

コンピュータの次なる発展が人工知能 (AI:Artificial Intelligence) であることに異論はない.従来のコンピュータは人間が書いた命令文をそのままの順序で実行するものであったのだが,その命令文が指示するパラメータ (重みとバイアスの値) をコンピュータ自身が最適化するようになったことが近年のAIの特徴である[注5].

この潮流はジェフェリー・ヒントン (Geoffrey Hinton) らが開発した物体認識技術が,2012年に行われた画像解析コンテストで圧倒的に優れた成績を収めたことが契機だ.コンピュータが大量のデータを機械学習し,ニューラルネットワークの中間層を多層化した深層学習によって解析する技術である.そこにはパラメータを自動的に最適化するアルゴリズムが組み込まれ,その最適化されたパラメータを用いてコンピュータ自身が画像データを解析してコンテストでの好成績を収めたのだ.なお,具体的なパラメータの最適化プロセスは,(i) 学習データを訓練データとテストデータに分割し,(ii) 訓練データを使って解析モデルに用いられるパラメータを最適化する.そして,(iii) テストデータで解析モデルの妥当性を評価するといった手順である.

画像認識の分野で急速に進化したAIの深層学習の手法は,音声認識や自然言語処理 (NLP:Natural Language Processing) などの分野にも応用され,それは生成AI (Generative AI) へと進化した.生成AIには新しいコンテンツを自動的に生成する能力がある.入力されたプロンプトに応じて,オリジナルな文章,プログラムコード,画像,動画,3Dモデル,音声,音楽などを生成する技術である[注6].深層学習によって既存データから特徴を抽出し,既存データを文字で表現された特徴と関連付ける.そして文字で表現された特徴の組み合わせ (プロンプト) を入力すると,既存データを組み合わせた新規なコンテンツを自動生成して出力するのだ.

パソコンの黎明期にはBASICでプログラムを作成することが唯一のパソコンの活用法であったのだが,その後はアプリケーションを使いこなすことがパソコン活用法として重視されるようになった.そして,インターネットを通じてAIにプロンプトを入力して指示すれば,即座に回答が返ってくる時代が訪れた.AIの回答は次第に改善されてきて,生成AIの活用による情報漏洩や著作権の侵害リスクの考慮が必要なことは事実だが,かなりの信憑性が担保されるようになってきたことも事実だ.実際,将棋や囲碁の対局でコンピュータソフトやAIに差し手を尋ねることが不正行為とされることは,コンピュータの指示に従うことが得策であることを追認した証拠だ.

今後はますますAIの信頼性が高まるだろうから,コンピュータの指示に従うすべての判断が得策となる時代の到来はまもなくだ.現在,日常業務にAIが活用され始めているが,最終判断は人間が行っている.しかし,将棋や囲碁のソフトウェアのように人間よりコンピュータの判断が勝ることが暴露されれば,最終判断をAIが下すことになることは必至だ.コンピュータの指示に従う時代の扉が開かれ始めているのだ.

2005年にレイ・カーツワイル (Ray Kurzweil) は,汎用人工知能 (AGI:Artificial General Intelligence) の能力が急速に高まって人間の知能を大幅に凌駕し,人間生活の変容をきたすような甚大な影響を及ぼす特異点 (Singularity) が2045年に到来すると予想した[18].2025年の時点でもChatGPTやCopilotやGeminiなどの機能を利用すれば,プロンプトとして送った質問に対する人知を超えた丁寧な回答が受け取れる.その回答が正解かどうかを確認することは必ずしも容易ではないが,人知を超えた素早い回答であることには間違いがない.

自然言語処理技術を応用したAIの現状レベルはすべての問い掛けに迅速に回答することをモットーとしている.現在のAIは判断基準となるデータの多くを虚言や暴言も含まれるインターネットから取り込むから,不適切な情報は検閲によって削除されるとしても現実世界からの乖離は避けられない.AIの回答には倫理的な配慮は重視されず,回答精度が低いから回答を差し控えるといった選択肢の用意もないのだが,AIが回答する役割を全うするならば,人間の役割は現実世界からの必要な情報を与えて質問を考えることしか残っていない[注7].

進化したAIの判断が人間より優れることが判明すると新たな事態に遭遇する.AIの判断を受け入れて経営判断をAIに委任した企業が栄え,AIの判断を受け入れて政治判断をAIに委任した国家が栄える時代の到来だ.AIの判断を疑うことなく受け入れる性向は詐欺に騙される被害者とも共通するから,AIの提供する虚偽情報 (ハルシネーション) や未学習の事態に直面したAIが提供する低精度の情報などによって甚大な被害を受ける企業や国家の出現は否定しがたいが,AIにすべての判断を委託することが社会の在り方に甚大な影響を及ぼす可能性の高いことも否定しがたいのだ.

これまでの時代にはコンピュータを操るIT人材が重用されてきたが,これからの時代に利を得るのはコンピュータに操られてその意のままに行動するAI信者なのかもしれない.生成AIを活用したフェイク画像や動画の生成による倫理的な問題の発生は否定しがたいが,AIの活用によって利を得ることが可能な時代の到来も否定しがたいだろう[注8].技術進歩によって人体と機械が融合した脱人間もどきの誕生の可能性を否定しがたいとしても,考える葦が新たなAI環境への適応力を低下させ,AI信者が適応力を高めるならば,生息環境の変化に適応すべく進化を遂げる新たな生き物が何も考えない葦だといった進化論的推察も否定しがたいようである.

[注1] 原子は原子核と電子から構成されている.古典的な解釈によれば,原子核は原子の中心部に存在する正の電荷を持った粒子で,電子は原子核の周囲を巡る負の電荷を持った粒子だ.そして電子の軌道とエネルギーはシュレーディンガー方程式を解くことによって与えられる.水素原子についての解はよく知られていて,1s,2s,2p,3s,3p,3d・・・といった離散的なエネルギー準位を持った電子軌道が形成される.しかし,現実には原子が単独で存在することは稀で,原子同士が互いに化学結合して分子や結晶を構成していることが普通だ.エネルギー的に安定な状態を作り出すことのできる化学結合としては金属結合,共有結合そしてイオン結合が重要だ.イオン結合は正イオンと負イオンの存在に起因する静電エネルギーによって安定な状態を作り出すのだが,金属結合と共有結合はエネルギー準位の高い外殻電子の軌道が変化して安定な状態を作り出す.金属結合では結晶全体を走り回る電子軌道が形成され,共有結合では原子同士を化学結合する軌道 (sp3やsp3d2などの混成軌道) が形成される.金属が電気を通すのは結晶全体を自由に動き回ることのできる自由電子が存在するからで,絶縁体が電気を通さないのはすべての電子が原子核に強く縛り付けられているために自由な運動が抑制されることによる.バンドギャップ (Band Gap) の大きな物質が電子を強く縛り付けるのだが,温度が高くなれば少しずつ電気を通すようになるのは熱振動のエネルギーの一部が電子にも配分され,電子が束縛を脱して少しずつ自由な運動が可能となるためだ.極めて高純度のシリコンは室温でもある程度の電気伝導性を示すバンドギャップの小さい物質 (真正半導体) の代表だが,微量の不純物が含まれるとその半導体のバンドギャップは大幅に小さくなる.n型の不純物半導体ではドナーバンド,p型の不純物半導体ではアクセプタバンドが形成されるからだ.微量のリンなどを添加したn型半導体は電子が過剰となり,それは自由電子のように結晶中を走り回って電気伝導性に寄与する.微量のホウ素などを添加したp型半導体は電子が不足するのだが,電子の不足した部分はあたかも正の電荷を持った電子のように振舞って電気伝導性に寄与する.この電子の欠損が正孔あるいはホール (Hole) と呼ばれるのは,電子がぎっしりと詰まって動きのとれない状態の中にできた孔に例えた表現だ.空孔は結晶内に存在する格子欠陥で,それによって固体内の拡散が助長されるのだが,正孔はそのメカニズムの電子版に相当する.

[注2] デジタルカメラで撮影した画像はレンズを通してイメージセンサ上に結像する.イメージセンサには多数の微細な画素が並べられていて,それぞれの画素に入力した光信号に応じて画素は明るさと色を認識する.画像データの大きさの単位は kB あるいは MB が一般的だ.1 MB = 1000 kB で,1 kB = 1024 Byte の関係がある.画像データの大きさはイメージセンサの画素数に大きく依存する.

[注3] 1971年に本学に設置された情報処理センターに設置された計算機システム HITAC 8700にはFORTRANがプログラミング言語として採用され,プログラムとデータはパンチカードで入力され,計算結果は紙に印字されて出力された.ただし,プログラム等に不備があれば,そこでプログラムはそこで停止してしまうから,パンチカードを並べる順序やデータの様式などの間違い探しに奔走するはめに陥る.そして間違い探しの作業で正解に辿り着かなければ,その先に進むことを諦めねばならなかった.当時のコンピュータは空調が効いた大きな部屋を独占していたのだが,当時の学生は暑い夏に扇風機で頭を冷やしながら間違い探しの作業に勤しんだのだ.コンピュータはその後,処理能力によっていくつかのタイプに分化した.ワークステーションはパソコンより高性能のコンピュータだが,パソコンの能力が高まるとその境界は曖昧になってきた[19].さらに高性能の大型コンピュータ (メインフレーム) は大規模システムへの応用が主な用途だ[20, 21].オンラインバンキングやATMといった金融機関の取引処理システム,クレジットカード決済システム,航空予約システムなどの応用にはセキュリティと信頼性が担保されることが必須なのだ.そして大規模な科学技術計算等に用いられるスーパーコンピュータの処理能力はさらに高い.三体問題のように解析的に解けない問題の近似解をシミュレーションによって得ようとするとき,カオス的な挙動に移行する前の短期的な領域に限定するならば,コンピュータの能力を際限なく高めることが重要になるからだ.

[注4] 1976年にNECから発売されたマイクロコンピュータ (Training KIT TK-80) は16進数での入力装置 (キーパッド) と10進数での出力装置 (8桁の7セグメントディスプレイ) を備えたワンボードマイコンだ.マイクロプロセッサに16進数で入力した結果を10進数で出力する仕組みである.TK-80は電気技術者の教育用に開発されたのだが,手頃な価格でもあったのでアマチュアや学生にも人気があり予想を超えるヒット商品になった.日本におけるキーボード入力によるパソコンの幕開けは8ビット機のPC-8001が発売された1979年頃だ.それまではコンピュータを操作するには高価で巨大な大型コンピュータが必要であったが,パソコンは手頃な価格で入手できる卓上のコンピュータだからだ.電源を入れるとコンピュータプログラムのBASICが起動することは画期的であり,BASICによる命令文をキーボードから入力し,そのプログラムを走らせると (命令文「RUN」を入力),その演算結果は出力装置としてパソコンに接続したアナログテレビの画面 (CRT Display) に表示された.1982年に発売された16ビット機のPC-9801は,MS-DOSをオペレーティングシステムに採用した.オペレーティングシステムとはアプリケーションプログラム (ユーザが直接操作するソフトウェア) とコンピュータハードウェア間のインターフェースだ.さまざまなアプリケーションプログラムが駆動するのは適合するオペレーティングシステム上に限られ,オペレーティングシステムを通じてアプリケーションプログラムの命令がコンピュータハードウェアに伝わるのだ.PC-9801には2枚のフロッピーディスクドライブが接続可能であり,アプリケーションプログラムをその1枚のフロッピーディスクで駆動し,作成したデータをもう1枚のフロッピーディスクに保存することが一般的な使用法で,アプリケーションプログラムとしてはワープロソフトの一太郎と図形ソフトの花子が人気を博した.1986年に発売されたMacintosh PlusのオペレーティングシステムはClassic Mac OSだ.キーボードに加えてマウスでの入力が可能となり,マルチウィンドウによって複数のアプリケーションプログラムを同時に操作可能となったことは画期的であった.その後に出現した代表的なパソコン用オペレーティングシステムとしては,Microsoft Windows (1995年にMicrosoft Windows 95が発表されてから人気を集めた) と2001年にAppleが新規に導入したmacOSである.そして昨今のスマートフォンではAndroidとiOSがあまねく利用されている.

[注5] 1956年に人工知能 (AI) という言葉が誕生し,ゲームプログラムに関する研究や専門家の意思決定ルールを体系化してソフトウェアとして記述するエキスパートシステムの研究が盛んになった.そして,1997年にはチェスに特化したコンピュータシステムであるIBMのディープブルー (Deep Blue) がチェスの世界チャンピオンに勝利し,2011年にはワトソン (IBM Watson) がクイズ番組で優秀な成績を収めた[22].これらのシステムはソフトウェアに書き込まれた手順に従ってコンピュータが動作するものだ.コンピュータにはインプットされたデータを指定された方法で演算処理してその結果をアウトプットする能力があるのだが,2010年頃から発達した近年のAIでは訓練データを用いたアウトプットと正解の誤差を小さくするように演算処理の方法を最適化するアルゴリズムが内蔵されている.そしてその精度を上げる工夫がニューラルネットワークだ.多層化したニューラルネットワーク (ディープラーニング) ではインプットされたデータを演算処理して第1の中間層 (Hidden Layer) に出力し,それをさらに演算処理して次の中間層に出力することを繰り返す[23a, 23b].近年のAIの能力向上は,訓練データを用いた最終的なアウトプットの値と正解の誤差を極小化するアルゴリズムを工夫した成果だ.演算処理に使用する重み行列とバイアス値の自動調整を行うアルゴリズムの工夫によってAIの能力は飛躍的に向上したのだが,精度を高めるべく膨大な演算を実行するために必要な消費電力も飛躍的に増大した.

[注6] 生成AIの技術革新は現在進行中だ[24a, 24b].画像生成AIは言葉で指示することによって画像を生成するAIだ.2014年に敵対的生成ネットワーク (GAN:Generative Adversarial Networks) というアルゴリズムが発表され,画像生成AIの技術革新が進んだ.データを生成するプログラム (生成ネットワーク:Generator) とデータが本物か偽物かを判別するプログラム (識別ネットワーク:Discriminator) が競い合うことで生成するプログラムが本物に近いデータを作れるようになる仕組みだ.2020年に実用化された拡散モデル (Diffusion Model) は,ノイズが加えられて画像が破壊される過程を学習し,その逆の工程を実行する.段階的にノイズを除去することによって,高品質な画像を生成するのだ.2022年にOpenAIが公開した対話型のChatGPT (Chat Generative Pre-trained Transformer) には2017年に発表された深層学習モデルのTransformerが使われている.自然言語処理のアルゴリズムは文章をまず単語に分割し,次に構文解析によって単語同士の関係性を解析するのだが,Transformerは重要な部分に注意を向ける注意機構 (Attention Mechanism) を取り入れることによって機械翻訳の飛躍的な性能向上を成し遂げたのみならず,人間とのスムーズな対話も実現した.生成AIにとって,オリジナルな文章,プログラムコード,画像,動画,3Dモデル,音声,音楽などの生成は人間との気軽なお喋りの一部に過ぎないのだが,知能の低い人間はこれを大層ありがたがる.

[注7] 生成AIの活用は業務効率化の観点から積極的に進められているが,慎重なのは教育現場だ[25, 26].多くの大学では生成AIの利用に関するガイドラインを策定している.学生が自力で作成したレポートと生成AIを利用して自動生成したレポートを教員が判別することの困難さに加えて,安直に生成AIに依存することで学生の批判的思考力や創造的思考力の発達が阻害される危惧があるからだ.しかし,生成AIの能力が高まるにつれて,生成AIの利用が急速に広まっているのは現実だ[27].暗算や筆算による計算能力が電卓の操作能力に置き換わったように,現在は人間の思考力が生成AIの利活用能力に置き換わる移行段階にあるのかもしれない.実際,学校を卒業して社会人ともなれば,ITの援用能力に加えてAIの利活用能力も重視されるから,独力で問題解決を図るだけではなく,さまざまな資源を活用する能力開発を学校で学ぶことは将来の糧になるはずだ.

[注8] 生成AIによって創造された画像や動画を現実と偽れば,ディープフェイク (偽画像,偽音声,偽映像など) やフェイクニュース (虚偽報道) になる.

文献
1.山田昭彦,日本の初期のコンピュータに関する考察,電気学会論文誌A,121 [1] 32-38 (2001).
2.谷腰欣司,トコトンやさしいトランジスタの本,日刊工業新聞社 (2008).
3.柳井久義,集積回路,日本機械学会誌,70 [582] 991-999 (1967).
4.菅野卓雄,集積回路の進歩と発展,応用物理,51 [7] 758-763 (1982).
5.鈴木大三,鈴木八十二,トコトンやさしいデジタル回路の本,日刊工業新聞社 (2015).
6.吉田秀雄,電卓の記憶装置と計算システム,実務表面技術,24 [3] 116-123 (1977).
7.加藤明,PC-8001の開発,通信ソサイエティマガジン,15 58-65 (2010).
8.柳良二,パソコンとはなにか,ターボ機械,15 [7] 402-410 (1987).
9.東山勇,パソコンとは,農業土木学会誌,53 [1] 5-12 (1985).
10.下条徳英,蛍光表示管材料,化学と教育,38 [4] 402-404 (1990).
11.松田克基,蛍光表示管,表面科学,9 [4] 305-310 (1988).
12.森本清,蛍光表示管,照明学会誌,73 [12] 746-751 (1989). 
13.天野真家,森健一,漢字・日本語処理技術の発展:日本語ワードプロセッサの誕生とその歴史,情報処理,43 [11] 1217- 1215 (2002).
14.土井美和子,日本語ワープロが製品化されるまで,通信ソサイエティマガジン,16 74-79 (2011).
15.高橋達郎,情報処理機械 日本語ワードプロセッサ,情報管理,23 [6] 525-535 (1980).
16.岩城正宏,掛樋一晃,初心者のためのコンピュータの知識―Macintoshの概要および操作(基礎編),薬学図書館,39 [1] 28-35 (1994).
17.岩城正宏,掛樋一晃,初心者のためのコンピュータの知識―Macintoshの概要および操作(応用編),薬学図書館,39 [4] 264-279 (1994).
18.レイ・カーツワイル,ポスト・ヒューマン誕生,NHK出版 (2007).
19.田中忠次,ワークステーション,農業土木学会誌,62 [8] 782 (1994).
20.薦田憲久,森久博,企業情報システムの変遷と今後の展望,電気学会誌,126 [9] 594-598 (2006).
21.斎藤謙一郎,航空予約システムとその動向,電気学会誌,123 [6] 349-353 (2003).
22.内野明,深層学習がもたらすもの:AIと囲碁との関係から,日本情報経営学会誌,43 [3-4] 5-17 (2024).
23.例えば,(a) 生成AIは、大学1年の数学で習う線形代数から成り立っている:https://indepa.net/archives/6795
 (b) ニューラルネットワークの基礎:https://tutorials.chainer.org/ja/13_Basics_of_Neural_Networks.html 
24.例えば, (a) 西崎博光,生成AIのこれまでの変遷と展望,通信ソサイエティマガジン,17 [4] 281-284 (2024).
 (b) 辻井潤一,大規模言語モデルと言語系生成AI,通信ソサイエティマガジン,18 [3] 241-250 (2024).
25.原田隆史,大学教育現場における生成AI技術の利用,情報の科学と技術,74 [8] 298-303 (2024).
26.竹田俊之,大学は生成系AIの影響をいかに認識しているか?,日本教育工学会研究報告集,2023 [2] 88-94 (2023).
27.齋藤渉,学生の生成AI利用とその利用目的に関する一考察 学生意識調査の結果から,大学情報・機関調査研究集会 論文集,13 119-125 (2024).

コメントを残す