ノウハウ AIレビューが「自社基準」にならない理由|自社基準レビュー成熟度レベル(Layer 0〜5)
投稿日:2026年06月15日
AIレビューが「自社基準」にならない理由|自社基準レビュー成熟度レベル(Layer 0〜5)

「AIレビューを入れたのに、自社基準にならない」
契約レビューにAIを導入した法務部門から、よく聞かれる声があります。「プレイブックは整備した。なのに、AIのレビュー結果が現場の判断とどこかズレる」「過去にOKを出したのと同じ案件を、AIは要修正と弾いてくる」——。
このとき、多くの方が「AIの精度がまだ足りない」「もっと高性能なモデルを待つべきか」と考えます。しかし、違和感の正体は、たいていの場合AIの性能ではありません。AIに渡している「判断基準」が不完全だからです。
法令違反ではないけれど「自社として絶対にやらない線」、過去に特定の取引先にだけ認めた例外、ベテランが一瞬で下している分類の判断——これらはどれも、整備したプレイブックの「外側」に存在します。そして、その外側は、いまAIにはまったく見えていません。判断基準がプレイブック止まりであるかぎり、その外側は構造的に見えないのです。
では、どこまでAIが判断基準を扱えれば「自社基準レビュー」と呼べるのか。「できる/できない」の二択で語るのをやめ、到達レベル(成熟度)として捉え直すと、議論がはっきりします。
レビューは「判断対象 × 判断基準 × 判断主体」でできている
成熟度の話に入る前に、契約レビューという行為を分解しておきます。レビューは、次の3つの要素で成り立っています。
- 判断対象:契約書そのもの(条項・取引条件などの事実)
- 判断基準:何を正しさのものさしにするか
- 判断主体:誰が/何がその判断を下すか
AIレビューの精度を左右するのはこの3つですが、なかでも決定的なボトルネックになっているのが判断基準です。判断対象(契約書本文)は明示的で、AIにそのまま渡せます。判断主体をAIに任せること自体も、いまや難しくありません。問題は、判断基準の中身が、どこまでAIに渡せているかにあります。
そして判断基準の多くは、明文化されないまま「基準」と「判断主体の頭の中」に偏って存在します。だからこそ、判断基準をどこまで渡せているかが、そのまま自社基準レビューの成熟度になります。
自社基準レビューの成熟度レベル(Layer 0〜5)
判断基準の充足度を軸に、自社基準レビューの到達レベルを6段階で整理したものが、次の成熟度モデルです。
| Layer | AIが使える判断基準 | レビューの状態 |
|---|---|---|
| L0 | なし | 一般論で丸投げ。「一般的に問題ないか」しか見られない |
| L1 | ひな形・条文 | 形式チェック。自社ひな形との差分は見えるが、許容可否は判断できない |
| L2 | プレイブック | 明文化済みの自社基準で判断できる。多くの既存製品の上限 |
| L3 | 暗黙知 | ベテランの判断・絶対NGまで踏まえる。「自社として絶対にやらない線」が効く |
| L4 | 例外処理 | 過去の判断履歴・例外承認を踏まえ、条件付きで許容できる |
| L5 | 自動で育つ基準 | 判断と前提を生成AIが記録し、判断基準そのものが更新され続ける |
ここで強調したいのは、「自社基準レビュー」と現場が実感できるのは、Layer 3(暗黙知)以降だということです。L1の形式チェックも、L2のプレイブック準拠も、それ自体は有用です。しかし「あの人が見たときと同じ判断」「うちの会社らしい線引き」を再現できているか、という観点では、L2まではまだ入口にすぎません。
Layer 2 と Layer 3 の間にある「崖」
この成熟度モデルで最も重要なのが、L2とL3の間にある崖です。プレイブックは「どこまで譲歩してよいか」という明文化された許容範囲を扱います。しかしその外側——暗黙知や例外処理——は、明文化されていないがゆえに、構造的にAIの視界に入りません。
そして多くのAIレビュー製品、とりわけAI内蔵型の製品は、この崖の手前、すなわちL2で止まります。これは「内蔵されたAIの頭が悪いから」ではありません。製品が見に行ける情報の範囲が、プレイブック1つに閉じているからです。暗黙知が書かれた絶対NG集も、過去の例外を記録した台帳も、過去の契約本体も、内蔵型AIの箱の外にあって参照できない。だからL3以降の判断材料に、そもそも手が届かないのです。
この「見に行ける情報の範囲」がなぜ製品設計で決まってしまうのかは、AI内蔵型CLMと連携型CLMを業務の分断という観点で比較した記事で詳しく整理しています。崖を越えられるかどうかは、性能ではなく設計思想の問題だ、という点が本質です。
「期待」と「実態」のギャップ
もう一つ、現場の違和感をうまく説明するのが、期待と実態のギャップです。
法務部門がAIレビューに期待する成果物のレベルは、最低でもLayer 3〜4です。ベテランと同じように、「これは例外として許容できる」「ここは絶対に譲れない」まで踏まえた判定がほしい。ところが、実際に出てくるアウトプットのレベルは、多くの場合Layer 1〜2にとどまります。この差こそが、「AIレビューを入れたのに自社基準じゃない」の正体です。
ギャップが生まれる原因は、大きく2つに分かれます。
- 一般的な生成AIを使う場合:AIの能力はL3〜4に届きうるのに、運用設計のミスと、案件データベースとの未接続によって、判断材料が渡らずL1〜2の出力にとどまる。
- AI内蔵型のレビュー製品の場合:そもそも製品のスコープがL2までしかカバーしておらず、設計上L3以降に到達できない。
前者は設計で解消できる余地がありますが、後者は製品の構造に起因するため、運用でカバーするのが困難です。
各レイヤーを引き上げる打ち手
成熟度は、放っておいて上がるものではありません。各レイヤーには、対応する具体的な打ち手があります。
- L1→L2(形式チェックから自社基準へ):レビュー観点を明文化したプレイブックを整備する。条項×観点の型をそろえる段階です。
- L2→L3(プレイブックの外側を可視化):ベテランの暗黙知を言語化し、絶対NG集として「自社として絶対やらない線」を渡せる形にする。
- L3→L4(例外を資産化):過去の例外承認や譲歩の判断履歴を、案件に紐づけて例外台帳に残し、レビュー時にAIが引けるようにする。
- L4→L5(基準が自動で育つ):新たな判断とその前提を生成AI自身が記録し、台帳や設計を更新し続けるループに乗せる。
このうち、暗黙知をどう拾って言語化するか、例外をどう台帳化するかは、それぞれ専用の手順があります。考え方の土台として、すでにAIを業務で使う法務部門がCLMに求める3条件では、AI資産・モデル自由度・ナレッジ集約という観点から、判断基準を特定ツールに閉じ込めずに育てる前提を整理しています。
なぜオープン型だけが Layer 4〜5 に届くのか
L3以降に到達できるかどうかは、突き詰めると2つの設計要素に行き着きます。
第一は、見に行ける情報の範囲です。L3の暗黙知(絶対NG集)も、L4の例外処理(例外台帳・過去契約・稟議)も、判断基準はあちこちに散在しています。これらを横断して参照できなければ、条件付きの許容判断はできません。内蔵型AIは1つの箱しか見られませんが、契約の受付・起案・承認・棚卸し・台帳・契約本体までを横断アクセスできる設計なら、散在した前提をたどって繋ぐことができます。
第二は、文脈の継承です。内蔵型AIは判断のたびに文脈がリセットされ、昨日の判断を今日に活かせません。一方、判断履歴が積み上がり、次の判断に再利用できる設計なら、使うほどに基準が育ちます。これがL5、つまり「自動で育つ基準」を可能にします。
この2つを同時に満たすのが、契約データはCLMに一元管理しつつ、レビューや判断には外部の汎用AI(ChatGPT・Claude・Gemini・Copilot)を接続して使う、連携型(オープン型)CLMという設計です。その思想と選定の考え方は、OpenCLMとは何かを選定基準とともに解説した記事で詳しく扱っています。
重要なのは、これが特定の賢いAIに依存した話ではない、という点です。判断ロジックと判断基準を自社の側に資産として残し、そこに最新の汎用AIを接続する。だからモデルが世代交代しても、積み上げた成熟度はそのまま引き継がれます。3〜5年というスパンで考えるほど、この「基準を自社に残す」設計の価値は大きくなります。
まとめ:自社基準は「設計」で再現できる
「AIレビューを入れたのに自社基準にならない」という違和感は、AIの性能不足ではなく、判断基準がプレイブック止まりであることから生まれます。自社基準と呼べるのはLayer 3(暗黙知)以降であり、多くの内蔵型製品はL2の崖の手前で止まります。
しかし、この崖は越えられないものではありません。暗黙知を言語化し、例外を台帳化し、判断と前提を記録し続ける——この設計を回せば、成熟度はL3、L4、そしてL5へと段階的に上がっていきます。そしてそれを構造的に可能にするのは、全工程に手が届き、判断履歴を蓄積できる連携型CLMだけです。
「AIは選び、契約は1箇所に集める」。判断ロジックと基準を自社に残す設計の上でこそ、ベテランの判断はAIで再現でき、使うほどに育っていきます。自社基準レビューは、気合いや属人ではなく、設計で再現できるのです。
本記事はContractS株式会社のコンテンツマーケティングチームが、エンタープライズ企業の法務・調達・管理部門向けに執筆したものです。自社基準レビューの成熟度をどう引き上げるかは、自社の体制・業務特性に応じて調整してください。本記事はリーガルアドバイスではありません。














