AIが勝手に作る謎の文字化けフォルダ原因と防止策とは?実際にキモいです…。

AIに「フォルダを整理して」「このファイルを作って」と作業を任せていたら、あとで見覚えのない変な文字が混じったフォルダが勝手にできていた。

中身も自分が作った記憶がない。これ、気持ち悪いですよね。

いや、ホント気持ちが悪かったです。最近のClaude Codeどうなってんの!?ってぐらい出力結果のクオリティが下がってる気がします。

先日、私の環境でまさにこれが起きました。フォルダ名をよく見ると、日本語の途中に見たこともない文字が1つ挟まっている。最初は乗っ取りや不具合を疑って少しゾッとしました。

結論から言うと、これはウイルスでも乗っ取りでもなく、AIの「文字化け」が原因でした。正確には、AIがまれに別の文字を出してしまう現象(ホモグリフ)と、ファイル作成ツールが指示通り素直にフォルダを作る挙動が、たまたま重なって生まれた1個のゴミフォルダです。実際に確かめた内容を、正直にまとめます(2026年6月時点)。

結論 ウイルスではなくAIの文字化けが原因

先に要点だけ。

  • できた謎フォルダはマルウェアや乗っ取りではありません。あわてて全消ししなくて大丈夫です。
  • 原因は2つの重なり。①AIがパスを書くとき、まれに別の文字を1つ紛れ込ませた ②ファイル作成ツールは、指定された通りに無い階層のフォルダを作る
  • だから「正しいフォルダ名のつもり」が、1文字違うだけでまるごと別の新しいフォルダとして静かに生まれます。
  • 中身を確認して自分が作ったものが無ければ、その誤字フォルダだけを削除すれば解決します。
実際にできた誤字フォルダ。「もらう」と「プロジェクト」の間に、紛れ込んだ見慣れない1文字(赤枠・文字コードU+0AAA)。筆者環境で再現した実画面。
実際にできた誤字フォルダ。「もらう」と「プロジェクト」の間に、紛れ込んだ見慣れない1文字(赤枠・文字コードU+0AAA)。筆者環境で再現した実画面。

何が起きたのか

私の場合、正しいフォルダ名はこうでした。

ファイルの全文は端折りますけど。

…もらうプロジェクト

ところが、AIがファイルを書き込むときに生成したパスは、「もらう」と「プロジェクト」の間に見慣れない文字が1つ挟まったものでした(実際の画面は下のスクリーンショット)。

…もらうપプロジェクトって何よ…。

その文字の正体は、文字コードでいう U+0AAA。インドで使われるグジャラート文字の「pa」にあたる、日本語とはまったく別の文字でした。日本語の「プ」と音は近いものの、見た目も用途も別物です。

この1文字違いのパスにAIがファイルを書き込もうとした結果、そのパスのフォルダ階層がまるごと新規に作られたわけです。

なぜ起きるのか 2つの理由が重なった

理由1 AIはまれに別の文字を出す

生成AIは、文章を1文字(正確にはトークン)ずつ、確率で選びながら作っています。ほとんどは正しく出ますが、ごくまれに見た目や音が近い別の文字を選んでしまうことがあります。

有名なのが「ホモグリフ」と呼ばれる、見た目がそっくりな別文字です。たとえばラテン文字の「a」(U+0061)と、それにそっくりなキリル文字の別の文字(U+0430)は、画面上ほぼ見分けがつきませんが、コンピューター上は完全に別の文字です。今回の U+0AAA は見た目こそ似ていませんが、「AIが想定外の別スクリプトの文字を紛れ込ませた」という意味で同じ仲間の現象です。

理由2 ファイル作成ツールは指示通りに作る

もう一つの理由は、AIが使うファイル作成ツールの素直さです。ファイルを保存するとき、その保存先フォルダが存在しなければ、ツールは足りないフォルダを自動で作ってから保存します(コマンドで言う mkdir -p と同じ動き)。これはツールとして正しい標準動作で、不具合ではありません。

つまりツール側は「このパスで合ってる?」とは聞きません。1文字違っていても、その通りのフォルダを黙って作るだけ。理由1と理由2が重なって、誤字のフォルダが1個ぽつんと生まれた、というわけです。

いや、わかります。

ここまでの話を聞くと「はぁ!?」ってなりますけど、AIは間違えてるつもりはないんですよ。

使ってる側からしてみたらめちゃめちゃ間違えてるんですけどね。

ホモグリフ 文字化けの正体

この「見た目が似た別の文字」問題は、実は世界的に知られた古い課題です。文字コードの国際規格を決める Unicode は、見間違えやすい文字どうしを confusables(混同しやすい文字) として正式に一覧化しており、その数は約6,500文字以上にのぼります。

もともとは「銀行サイトそっくりの偽ドメインを、見分けのつかない別文字で作る詐欺」を防ぐための仕組みですが、AIが文章を生成する場面でも、同じ「似た別文字の取り違え」が起こり得ます。最近はAIにコードやファイル操作をさせるツールが増え、こうした文字の混入が実務的な問題として扱われ始めています。

上が正規フォルダ、下が誤字フォルダ。名前は赤枠の1文字(U+0AAA)しか違わないのに、別の新しいフォルダとして作られてしまう。
上が正規フォルダ、下が誤字フォルダ。名前は赤枠の1文字(U+0AAA)しか違わないのに、別の新しいフォルダとして作られてしまう。

なぜ急に起きたのか

「今まで一度もなかったのに、なぜ急に」と思いますよね。これは確率的なレア現象で、起こりやすい条件がたまたま揃ったときに表面化します。私のケースでは次の3つが重なっていました。

  • 長い日本語のフォルダ名を何度も入力していた。フォルダ名が長く複雑な日本語だと、AIがその文字列を打ち直すたびに、ごくわずかな取り違えの確率が積み上がります。短いフォルダ名なら起きにくい現象です。
  • 日本語と英語と専門用語が濃く混ざる作業だった。複数の言語・文字が混在する文脈ほど、別の文字を取り違えやすくなります。
  • 長時間の連続作業だった。作業量が多いほど、まれな現象に当たる回数も増えます。

正直に言うと「過去に絶対なかった」とは言い切れません。気づかれずに残っていた可能性もあります。確かなのは「条件が揃うと、誰のAI作業でも起こり得る」ということです。

そう考えると、ちょっと怖いですよね…。

同じことを防ぐ5つの対策

  1. フォルダ名はできるだけ短く、できれば英数字で。長い日本語のフォルダ名は、今回のような取り違えに弱いです。新しく作るフォルダは英数字の短い名前にすると、起きにくく、起きても一目で気づけます。
  2. 作業後に「見慣れないフォルダ」が増えていないか確認する。AIにファイル操作を任せたら、親フォルダを軽く見て、名前がそっくりな兄弟フォルダが無いかチェックします。
  3. 中身を確認してから消す。怪しいフォルダは、いきなり消す前に中身を見ます。自分が作った記憶のないコピーだけが入っていれば、その誤字フォルダだけを削除すれば安全です。
  4. 大事なファイルはバックアップしてからAIに触らせる。これは文字化けに限らず、AIに自動作業をさせるときの基本です。
  5. 不安なら一度に任せる量を小さくする。長時間まとめて任せるより、区切って結果を確認するほうが、こうしたレア現象に早く気づけます。

よくある質問

Q. この謎フォルダはウイルスですか。消して大丈夫ですか。
A. 今回のようなケースはウイルスではなく、AIの文字の取り違えでできた空に近いフォルダです。中身を確認し、自分が作ったファイルが入っていなければ、その誤字フォルダだけ削除して問題ありません。不安なら中身を別の場所に退避してから消してください。

Q. これはAIツールの欠陥ですか。
A. 特定のツールの不具合というより、「AIがまれに別の文字を出す」ことと「ファイル作成ツールが指定通りにフォルダを作る」標準動作が重なって起きる現象です。どのAIコーディングツールでも起こり得ます。

Q. 自分では気づけません。どうすれば。
A. フォルダ名を短い英数字にする、作業後に親フォルダを見る、の2つだけでもかなり防げます。名前がそっくりなフォルダが2つ並んでいたら要注意のサインです。あと、体感ですが、一度このようなことがあると確率的にバグというかAIエージェントが馬鹿になってる状態な気がします。過去にルール化したことを忘れたり、「やれ」って言ったことがうまくできなくなってたり…。もしかしたら、フォルダの整理やmemoryや.claude

📬 新着記事をメールでお届けします

記事公開時にメールでお知らせします。週数本・無料・いつでも 1 クリックで解除できます。

uri uri

uri uriと申します。生成AI専門ブログ「生成AIニスト」運営者。 ChatGPT・Gemini・Claudeなど主要な生成AIを自分で契約し、毎日実際に触って検証しています。記事の手順やエラー対処は、必ず自分の画面で再現し、実機のスクリーンショットで確かめてから公開。料金や仕様は提供元の公式情報で裏取りし、いつ時点の情報かを明記します。「読んだ人が同じ画面で再現できること」を基準に書いています。