feat(providers): add multi-turn support and token logging for deep research

waleedlatif1 · waleedlatif1 · commit 56317f0928cc · 2026-02-10T22:41:55.000-08:00
diff --git a/apps/sim/blocks/blocks/agent.ts b/apps/sim/blocks/blocks/agent.ts
@@ -641,6 +641,16 @@ Example 3 (Array Input):
         generationType: 'json-schema',
       },
     },
+    {
+      id: 'previousInteractionId',
+      title: 'Previous Interaction ID',
+      type: 'short-input',
+      placeholder: 'e.g., {{agent_1.interactionId}}',
+      condition: {
+        field: 'model',
+        value: MODELS_WITH_DEEP_RESEARCH,
+      },
+    },
   ],
   tools: {
     access: [
@@ -804,5 +814,13 @@ Example 3 (Array Input):
       description: 'Provider timing information',
     },
     cost: { type: 'json', description: 'Cost of the API call' },
+    interactionId: {
+      type: 'string',
+      description: 'Interaction ID for multi-turn deep research follow-ups',
+      condition: {
+        field: 'model',
+        value: MODELS_WITH_DEEP_RESEARCH,
+      },
+    },
   },
 }
diff --git a/apps/sim/executor/handlers/agent/agent-handler.ts b/apps/sim/executor/handlers/agent/agent-handler.ts
@@ -999,6 +999,7 @@ export class AgentBlockHandler implements BlockHandler {
       reasoningEffort: inputs.reasoningEffort,
       verbosity: inputs.verbosity,
       thinkingLevel: inputs.thinkingLevel,
+      previousInteractionId: inputs.previousInteractionId,
     }
   }
 
@@ -1269,6 +1270,7 @@ export class AgentBlockHandler implements BlockHandler {
       content: result.content,
       model: result.model,
       ...this.createResponseMetadata(result),
+      ...(result.interactionId && { interactionId: result.interactionId }),
     }
   }
 
diff --git a/apps/sim/executor/handlers/agent/types.ts b/apps/sim/executor/handlers/agent/types.ts
@@ -20,6 +20,8 @@ export interface AgentInputs {
   conversationId?: string // Required for all non-none memory types
   slidingWindowSize?: string // For message-based sliding window
   slidingWindowTokens?: string // For token-based sliding window
+  // Deep research multi-turn
+  previousInteractionId?: string // Interactions API previous interaction reference
   // LLM parameters
   temperature?: string
   maxTokens?: string
diff --git a/apps/sim/providers/gemini/core.ts b/apps/sim/providers/gemini/core.ts
@@ -452,17 +452,34 @@ function extractTextFromInteractionOutputs(outputs: Interactions.Interaction['ou
 
 /**
  * Extracts token usage from an Interaction's Usage object.
- * The Interactions API provides total_input_tokens, total_output_tokens, and total_tokens.
+ * The Interactions API provides total_input_tokens, total_output_tokens, total_tokens,
+ * and total_reasoning_tokens (for thinking models).
+ *
+ * Also handles the raw API field name total_thought_tokens which the SDK may
+ * map to total_reasoning_tokens.
  */
 function extractInteractionUsage(usage: Interactions.Usage | undefined): {
   inputTokens: number
   outputTokens: number
+  reasoningTokens: number
   totalTokens: number
 } {
-  const inputTokens = usage?.total_input_tokens ?? 0
-  const outputTokens = usage?.total_output_tokens ?? 0
-  const totalTokens = usage?.total_tokens ?? inputTokens + outputTokens
-  return { inputTokens, outputTokens, totalTokens }
+  if (!usage) {
+    return { inputTokens: 0, outputTokens: 0, reasoningTokens: 0, totalTokens: 0 }
+  }
+
+  const usageLogger = createLogger('DeepResearchUsage')
+  usageLogger.info('Raw interaction usage', { usage: JSON.stringify(usage) })
+
+  const inputTokens = usage.total_input_tokens ?? 0
+  const outputTokens = usage.total_output_tokens ?? 0
+  const reasoningTokens =
+    usage.total_reasoning_tokens ??
+    ((usage as Record<string, unknown>).total_thought_tokens as number) ??
+    0
+  const totalTokens = usage.total_tokens ?? inputTokens + outputTokens
+
+  return { inputTokens, outputTokens, reasoningTokens, totalTokens }
 }
 
 /**
@@ -471,9 +488,15 @@ function extractInteractionUsage(usage: Interactions.Usage | undefined): {
 function buildDeepResearchResponse(
   content: string,
   model: string,
-  usage: { inputTokens: number; outputTokens: number; totalTokens: number },
+  usage: {
+    inputTokens: number
+    outputTokens: number
+    reasoningTokens: number
+    totalTokens: number
+  },
   providerStartTime: number,
-  providerStartTimeISO: string
+  providerStartTimeISO: string,
+  interactionId?: string
 ): ProviderResponse {
   const providerEndTime = Date.now()
   const duration = providerEndTime - providerStartTime
@@ -505,6 +528,7 @@ function buildDeepResearchResponse(
       ],
     },
     cost: calculateCost(model, usage.inputTokens, usage.outputTokens),
+    interactionId,
   }
 }
 
@@ -524,12 +548,19 @@ function createDeepResearchStream(
   stream: AsyncIterable<Interactions.InteractionSSEEvent>,
   onComplete?: (
     content: string,
-    usage: { inputTokens: number; outputTokens: number; totalTokens: number }
+    usage: {
+      inputTokens: number
+      outputTokens: number
+      reasoningTokens: number
+      totalTokens: number
+    },
+    interactionId?: string
   ) => void
 ): ReadableStream<Uint8Array> {
   const streamLogger = createLogger('DeepResearchStream')
   let fullContent = ''
-  let completionUsage = { inputTokens: 0, outputTokens: 0, totalTokens: 0 }
+  let completionUsage = { inputTokens: 0, outputTokens: 0, reasoningTokens: 0, totalTokens: 0 }
+  let completedInteractionId: string | undefined
 
   return new ReadableStream({
     async start(controller) {
@@ -546,6 +577,12 @@ function createDeepResearchStream(
             if (interaction?.usage) {
               completionUsage = extractInteractionUsage(interaction.usage)
             }
+            completedInteractionId = interaction?.id
+          } else if (event.event_type === 'interaction.start') {
+            const interaction = (event as Interactions.InteractionEvent).interaction
+            if (interaction?.id) {
+              completedInteractionId = interaction.id
+            }
           } else if (event.event_type === 'error') {
             const errorEvent = event as { error?: { code?: string; message?: string } }
             const message = errorEvent.error?.message ?? 'Unknown deep research stream error'
@@ -558,7 +595,7 @@ function createDeepResearchStream(
           }
         }
 
-        onComplete?.(fullContent, completionUsage)
+        onComplete?.(fullContent, completionUsage, completedInteractionId)
         controller.close()
       } catch (error) {
         streamLogger.error('Error reading deep research stream', {
@@ -595,6 +632,7 @@ export async function executeDeepResearchRequest(
     hasSystemPrompt: !!request.systemPrompt,
     hasMessages: !!request.messages?.length,
     streaming: !!request.stream,
+    hasPreviousInteractionId: !!request.previousInteractionId,
   })
 
   if (request.tools?.length) {
@@ -620,6 +658,9 @@ export async function executeDeepResearchRequest(
       background: true,
       store: true,
       ...(systemInstruction && { system_instruction: systemInstruction }),
+      ...(request.previousInteractionId && {
+        previous_interaction_id: request.previousInteractionId,
+      }),
       agent_config: {
         type: 'deep-research' as const,
         thinking_summaries: 'auto' as const,
@@ -685,31 +726,35 @@ export async function executeDeepResearchRequest(
         },
       }
 
-      streamingResult.stream = createDeepResearchStream(streamResponse, (content, usage) => {
-        streamingResult.execution.output.content = content
-        streamingResult.execution.output.tokens = {
-          input: usage.inputTokens,
-          output: usage.outputTokens,
-          total: usage.totalTokens,
-        }
+      streamingResult.stream = createDeepResearchStream(
+        streamResponse,
+        (content, usage, streamInteractionId) => {
+          streamingResult.execution.output.content = content
+          streamingResult.execution.output.tokens = {
+            input: usage.inputTokens,
+            output: usage.outputTokens,
+            total: usage.totalTokens,
+          }
+          streamingResult.execution.output.interactionId = streamInteractionId
+
+          const cost = calculateCost(model, usage.inputTokens, usage.outputTokens)
+          streamingResult.execution.output.cost = cost
 
-        const cost = calculateCost(model, usage.inputTokens, usage.outputTokens)
-        streamingResult.execution.output.cost = cost
-
-        const streamEndTime = Date.now()
-        if (streamingResult.execution.output.providerTiming) {
-          streamingResult.execution.output.providerTiming.endTime = new Date(
-            streamEndTime
-          ).toISOString()
-          streamingResult.execution.output.providerTiming.duration =
-            streamEndTime - providerStartTime
-          const segments = streamingResult.execution.output.providerTiming.timeSegments
-          if (segments?.[0]) {
-            segments[0].endTime = streamEndTime
-            segments[0].duration = streamEndTime - providerStartTime
+          const streamEndTime = Date.now()
+          if (streamingResult.execution.output.providerTiming) {
+            streamingResult.execution.output.providerTiming.endTime = new Date(
+              streamEndTime
+            ).toISOString()
+            streamingResult.execution.output.providerTiming.duration =
+              streamEndTime - providerStartTime
+            const segments = streamingResult.execution.output.providerTiming.timeSegments
+            if (segments?.[0]) {
+              segments[0].endTime = streamEndTime
+              segments[0].duration = streamEndTime - providerStartTime
+            }
           }
         }
-      })
+      )
 
       return streamingResult
     }
@@ -764,11 +809,21 @@ export async function executeDeepResearchRequest(
     logger.info('Deep research completed', {
       interactionId,
       contentLength: content.length,
+      inputTokens: usage.inputTokens,
+      outputTokens: usage.outputTokens,
+      reasoningTokens: usage.reasoningTokens,
       totalTokens: usage.totalTokens,
       durationMs: Date.now() - providerStartTime,
     })
 
-    return buildDeepResearchResponse(content, model, usage, providerStartTime, providerStartTimeISO)
+    return buildDeepResearchResponse(
+      content,
+      model,
+      usage,
+      providerStartTime,
+      providerStartTimeISO,
+      interactionId
+    )
   } catch (error) {
     const providerEndTime = Date.now()
     const duration = providerEndTime - providerStartTime
diff --git a/apps/sim/providers/types.ts b/apps/sim/providers/types.ts
@@ -95,6 +95,8 @@ export interface ProviderResponse {
     total: number
     pricing: ModelPricing
   }
+  /** Interaction ID returned by the Interactions API (used for multi-turn deep research) */
+  interactionId?: string
 }
 
 export type ToolUsageControl = 'auto' | 'force' | 'none'
@@ -169,6 +171,8 @@ export interface ProviderRequest {
   verbosity?: string
   thinkingLevel?: string
   isDeployedContext?: boolean
+  /** Previous interaction ID for multi-turn Interactions API requests (deep research follow-ups) */
+  previousInteractionId?: string
 }
 
 export const providers: Record<string, ProviderConfig> = {}

Original file line number	Diff line number	Diff line change
`@@ -999,6 +999,7 @@ export class AgentBlockHandler implements BlockHandler {`
`999`	`999`	`reasoningEffort: inputs.reasoningEffort,`
`1000`	`1000`	`verbosity: inputs.verbosity,`
`1001`	`1001`	`thinkingLevel: inputs.thinkingLevel,`
	`1002`	`+ previousInteractionId: inputs.previousInteractionId,`
`1002`	`1003`	`}`
`1003`	`1004`	`}`
`1004`	`1005`
`@@ -1269,6 +1270,7 @@ export class AgentBlockHandler implements BlockHandler {`
`1269`	`1270`	`content: result.content,`
`1270`	`1271`	`model: result.model,`
`1271`	`1272`	`...this.createResponseMetadata(result),`
	`1273`	`+ ...(result.interactionId && { interactionId: result.interactionId }),`
`1272`	`1274`	`}`
`1273`	`1275`	`}`
`1274`	`1276`
Original file line number	Diff line number	Diff line change
`@@ -95,6 +95,8 @@ export interface ProviderResponse {`
`95`	`95`	`total: number`
`96`	`96`	`pricing: ModelPricing`
`97`	`97`	`}`
	`98`	`+ /** Interaction ID returned by the Interactions API (used for multi-turn deep research) */`
	`99`	`+ interactionId?: string`
`98`	`100`	`}`
`99`	`101`
`100`	`102`	`export type ToolUsageControl = 'auto' \| 'force' \| 'none'`
`@@ -169,6 +171,8 @@ export interface ProviderRequest {`
`169`	`171`	`verbosity?: string`
`170`	`172`	`thinkingLevel?: string`
`171`	`173`	`isDeployedContext?: boolean`
	`174`	`+ /** Previous interaction ID for multi-turn Interactions API requests (deep research follow-ups) */`
	`175`	`+ previousInteractionId?: string`
`172`	`176`	`}`
`173`	`177`
`174`	`178`	`export const providers: Record<string, ProviderConfig> = {}`