OutputParserException: Failed to parse LLM output の原因と解決策

概要

LangChainの出力パーサーがLLMの応答を期待する形式にパースできない場合に発生するエラーです。

エラーメッセージ

langchain.schema.output_parser.OutputParserException: Failed to parse LLM output. Expected a JSON object, got: "I'll help you with that..."

OutputParserException: Could not parse function call: 'function_call' key not found in response

pydantic.error_wrappers.ValidationError: 1 validation error for Response

原因

1. LLMが期待する形式で応答しない

2. プロンプトの指示が不十分

3. モデルのJSON出力能力の限界

4. Pydanticモデルとの不一致

解決策

1. フォーマット指示を明確にする

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
from langchain.prompts import PromptTemplate
from langchain.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field

class Answer(BaseModel):
    answer: str = Field(description="The answer to the question")
    confidence: float = Field(description="Confidence score between 0 and 1")

parser = PydanticOutputParser(pydantic_object=Answer)

prompt = PromptTemplate(
    template="""Answer the question.

{format_instructions}

Question: {question}

Remember: You MUST respond with valid JSON only, no additional text.""",
    input_variables=["question"],
    partial_variables={"format_instructions": parser.get_format_instructions()}
)

2. リトライパーサーを使用

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from langchain.output_parsers import RetryWithErrorOutputParser

retry_parser = RetryWithErrorOutputParser.from_llm(
    parser=parser,
    llm=llm,
    max_retries=3
)

# パース失敗時に自動リトライ
result = retry_parser.parse_with_prompt(output, prompt_value)

3. OutputFixingParserを使用

1
2
3
4
5
6
7
8
9
from langchain.output_parsers import OutputFixingParser

fixing_parser = OutputFixingParser.from_llm(
    parser=parser,
    llm=llm
)

# 不正な出力を自動修正
result = fixing_parser.parse(malformed_output)

4. JSONモードを使用（OpenAI）

1
2
3
4
5
6
7
8
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="gpt-4-turbo",
    model_kwargs={"response_format": {"type": "json_object"}}
)

# JSONモードではJSON出力が保証される

5. 構造化出力を使用

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from langchain_core.pydantic_v1 import BaseModel

class Joke(BaseModel):
    setup: str
    punchline: str

# with_structured_outputを使用
structured_llm = llm.with_structured_output(Joke)
result = structured_llm.invoke("Tell me a joke")
# resultはJoke型で返される

6. エラーハンドリングを追加

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
from langchain.schema.output_parser import OutputParserException

try:
    result = parser.parse(llm_output)
except OutputParserException as e:
    # フォールバック処理
    print(f"Parse error: {e}")

    # 生のテキストとして扱う
    result = {"raw_text": llm_output, "parsed": False}

7. 正規表現パーサーを使用

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
from langchain.output_parsers import RegexParser

# JSON抽出用の正規表現
regex_parser = RegexParser(
    regex=r'\{[\s\S]*\}',
    output_keys=["json_content"]
)

# JSONブロックを抽出
json_str = regex_parser.parse(output)["json_content"]
result = json.loads(json_str)

8. マークダウンコードブロックの処理

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
import re
import json

def extract_json(text: str) -> dict:
    # ```json ... ``` ブロックを抽出
    pattern = r'```(?:json)?\s*([\s\S]*?)\s*```'
    match = re.search(pattern, text)

    if match:
        return json.loads(match.group(1))

    # 直接JSONとしてパース
    return json.loads(text)

OutputParserException: Failed to parse LLM output

概要

エラーメッセージ

原因

1. LLMが期待する形式で応答しない

2. プロンプトの指示が不十分

3. モデルのJSON出力能力の限界

4. Pydanticモデルとの不一致

解決策

1. フォーマット指示を明確にする

2. リトライパーサーを使用

3. OutputFixingParserを使用

4. JSONモードを使用（OpenAI）

5. 構造化出力を使用

6. エラーハンドリングを追加

7. 正規表現パーサーを使用

8. マークダウンコードブロックの処理

関連エラー

関連エラー

AI の他のエラー