【仕組み解説】全結合層をゼロから実装しよう：シリーズの全体像とロードマップ【ニューラルネットワーク入門】（NN #1）

　深層学習 (ディープラーニング)の技術の発展で、AIブームが起きていたのが記憶に新しいですが、ソフトやモデルがたくさんあり簡単に使える一方、その中身について、ゼロから考えてみるという記事やサイトは少ないと思います。

(実際AIを作るときも、便利なライブラリがあり、難しいことも一行でできてしまったりします。)

　「実務で使う分だけ」、「出力結果にしか興味がない」、「中身の知識は必要ない」、という場合は使い方だけわかればそれでいいと思いますが、私や一部の知識欲がある人は、その中身がわからないものを使っているとなんだかムズムズするものです。

　そこで、この記事シリーズでは、ディープラーニングに入るまでの道筋をその根本的な設計思想からディープラーニングの肝であり、基礎の最小単位である全結合層について、ゼロから作って理解していこうと思います。

　このシリーズを読んだらニューラルネットワークを知っている人から作れる人になる第一歩を踏み出せます。

できるだけかみ砕いて例を挙げながら、説明していくので、ちょこっと数学が好きな子供なら余裕で分かるくらいの難易度にたいと思っていますので、ついてきてください。

ニューラルネットワーク

はじめに、

「ニューラルネットワーク」は、人間の脳の神経細胞（ニューロン）の仕組みにヒントを得て作られた、非常に強力な数学的なモデルのことを言います。

「ニューラルネットワーク」と聞くと、何やら難解な数式や、TensorFlowやPyTorchといった専門的なライブラリを使いこなさなければならない、複雑な「ブラックボックス」を想像するかもしれません。

しかし、どれほど複雑に見えるAIも、分解してみれば基本的な部品（レイヤー,層）の組み合わせでできています。

　この層が深いものをディープ（深い）ニューラルネットワークといい、GPTやGeminiなど皆さんがよく目にするようなAIと言われているものはこれに該当するものになります。

深くすることで、より複雑な問題を推論することができるようになりますが、これがなぜなのかについても今後の記事で触れていきたいと思います。

「車輪の再発明」は無駄だと言われますが、学習においては最強の近道です。

このシリーズでは、以下のような構成で順に全結合層の中身を実装していこうと思います。

はじめは、ニューラルネットワークの原点である「パーセプトロン」という単純なモデルからスタートして、学習を行うバックプロパゲーション、簡単な問題をNNで解いてみるというところまでこのシリーズで紹介しようと思います。

第1章：パーセプトロン
- AIの最小単位とも言える「パーセプトロン」を学び、単純な論理回路（AND, OR）を実装します。そして、なぜそれだけでは不十分なのか（XOR問題の壁）を知ります。
第2章：壁を越える（多層パーセプトロン）
- パーセプトロンの限界を突破するため、「層を重ねる」こと、そして「活性化関数」という“非線形性”を導入し、ニューラルネットワークへと進化させます。
第3章：全結合層（Affineレイヤー）の実装
- ニューラルネットワークの中核部品である「全結合層」の正体が、実は高校数学で習う「行列の積（アフィン変換）」であることを学び、順伝播（入力から出力を計算する処理）をコードに起こします。
第4章：学習の仕組み（バックプロパゲーション）
- AIが「賢くなる」とはどういうことか？答えの「誤差」をどのように入力側の「重み」にフィードバックするのか、学習の核心である「誤差逆伝播法（バックプロパゲーション）」を実装します。