GenerationChunk is needed for on_llm_new_token

NVIDIA · drazvan · Feb 15, 2024 · Feb 14, 2024 · Feb 14, 2024 · Feb 14, 2024
commit b50316e40c3909853705c64304095a5111a2e098
diff --git a/nemoguardrails/llm/providers/providers.py b/nemoguardrails/llm/providers/providers.py
@@ -31,6 +31,7 @@
 )
 from langchain.llms.base import LLM
 from langchain.llms.huggingface_pipeline import HuggingFacePipeline
+from langchain.schema.output import GenerationChunk
 from langchain_community import llms
 
 from nemoguardrails.rails.llm.config import Model
@@ -116,8 +117,9 @@ async def _acall(
  completion = ""
  async for item in streamer:
  completion += item
+ chunk = GenerationChunk(text=item)
  if run_manager:
- await run_manager.on_llm_new_token(item)
+ await run_manager.on_llm_new_token(item, chunk=chunk)
  return completion
 
  llm_result = await self._agenerate(