AIはどのように調査対象を選ぶのか
情報公開で入手した東京国税局の部内資料に目を通すと、すでに実務の現場で、所得課税部門では「SAT」、法人課税部門では「結」、資産課税部門では「RIN」といった名称の、調査選定を支援するAIシステムが利用されているようである。
もっとも、これらのAIが具体的にどのような仕組みで動いているのか、その詳細は明らかにされていない。そこで、入手した資料等を踏まえつつ、AIによる調査選定の仕組みをイメージとして整理してみたい。
国税庁には、申告書の情報をはじめ、過去の税務調査の結果など、膨大なデータが長年にわたり蓄積されている。AIによる調査選定とは、これらのデータを用いて、「どのような要素に着目すれば、申告漏れの可能性が高い納税者、すなわち税務コンプライアンスリスクの高い者を抽出できるのか」を自動的に分析する仕組みである。
イメージとしては、申告漏れの可能性が高い者を判定するための「計算式(予測モデル)」をAIが自動的に導き出し、その後は、当該計算式を構成する各要素のデータを新たな納税者について当てはめることで、申告漏れリスクの高い者を抽出していくようなものである。
例えば、業種、収入金額や所得金額の推移、生活実態に関する情報などを考慮する計算式が構築されることが想定される。ただし、こうした要素の組み合わせ自体は、従来の「機械による調査選定」と大きく変わらないようにも見える。
AIを利用する場合の本質的な違いは、①その計算式が過去の税務調査データ等から自動的に生成される点、②その精度が高い点、③人間の発想では着目しにくい要素が組み込まれる可能性がある点──にあると考えられる。こうした点において、従来の調査選定とは質的に異なる特徴を有しているといえよう。
さらに重要なのは、国税庁が保有する情報の範囲である。
国税庁には、納税者本人に関する情報にとどまらず、家族、従業員、勤務先や取引先、金融機関、行政機関、さらには外国の税務当局との情報交換、インターネット上の公開情報(ホームページ、ブログ、SNS等)など、極めて多様なルートから情報が集積されている。これらの情報が、AIによる調査選定において、直接的または間接的に活用されている可能性は否定できない。
こうした状況を踏まえると、国税庁がAIを用いて、申告漏れの可能性が高い納税者を相当程度の精度で「あぶり出そう」としていることは、十分に想像がつく。