Divinci AI ブログ

人工知能、RAG システム、エンタープライズ AI 管理に関する洞察、更新情報、そして思考のリーダーシップ。

Product

How to Diagnose Custom LLM QA Failures in 7 Steps

著者: Mike Mooring • May 31, 2026

Most 'QA failures' aren't model failures — they're eval gaps, judge mis-calibration, or training-serving skew. A 7-step diagnostic that proves it.

記事を読む

Divinci AIチームによる研究ノート

Divinci AIのブログでは、規制産業向けのプロダクション対応の検索拡張生成（RAG）システム構築における、独自の研究、エンジニアリングの詳細解説、現場からのフィールドノートを公開しています。

私たちの発信は3つのテーマにわたります。まず技術的な取り組みとして、Hugging Faceで公開しているオープンなvIndexesライブラリをどのように構築・スコアリング・ルーティングしているか、AIジャッジを人間のグラウンドトゥルースに対してどのように較正しているか、投機的デコーディングとFP8量子化をプロダクションに投入して得た学びについて紹介します。

ほとんどの記事は、すでにAIエンジニアリングに精通した読者、つまりエンジニア、研究者、技術購買担当者を対象としていますが、組織内でAIに関する意思決定を担うすべての方にとって理解しやすいよう、フレーミングにも配慮しています。