🚿

2023-06-13 21:50:44 -07:00 · 2023-06-13 21:50:44 -07:00 · 19cb765db1
commit 19cb765db1
--- a/src/llms/chat.ts
+++ b/src/llms/chat.ts
@ -1,5 +1,4 @@
 import { JSONRepairError, jsonrepair } from 'jsonrepair'
-import pMap from 'p-map'
 import { dedent } from 'ts-dedent'
 import { type SetRequired } from 'type-fest'
 import { ZodType, z } from 'zod'
@ -8,7 +7,6 @@ import { printNode, zodToTs } from 'zod-to-ts'
 import * as errors from '@/errors'
 import * as types from '@/types'
 import { getCompiledTemplate } from '@/template'
-import { getModelNameForTiktoken } from '@/tokenizer'
 import {
  extractJSONArrayFromString,
  extractJSONObjectFromString
@ -16,6 +14,7 @@ import {

 import { BaseTask } from '../task'
 import { BaseLLM } from './llm'
+import { getNumTokensForChatMessages } from './llm-utils'

 export abstract class BaseChatModel<
  TInput extends void | types.JsonObject = void,
@ -255,63 +254,11 @@ export abstract class BaseChatModel<
    }
  }

-  // TODO: this needs work + testing
-  // TODO: move to isolated file and/or module
-  public async getNumTokensForMessages(messages: types.ChatMessage[]): Promise<{
-    numTokensTotal: number
-    numTokensPerMessage: number[]
-  }> {
-    let numTokensTotal = 0
-    let tokensPerMessage = 0
-    let tokensPerName = 0
-
-    const modelName = getModelNameForTiktoken(this._model)
-
-    // https://github.com/openai/openai-cookbook/blob/main/examples/How_to_format_inputs_to_ChatGPT_models.ipynb
-    if (modelName === 'gpt-3.5-turbo') {
-      tokensPerMessage = 4
-      tokensPerName = -1
-    } else if (modelName.startsWith('gpt-4')) {
-      tokensPerMessage = 3
-      tokensPerName = 1
-    } else {
-      // TODO
-      tokensPerMessage = 4
-      tokensPerName = -1
-    }
-
-    const numTokensPerMessage = await pMap(
+  public async getNumTokensForMessages(messages: types.ChatMessage[]) {
+    return getNumTokensForChatMessages({
      messages,
-      async (message) => {
-        let content = message.content || ''
-        if (message.function_call) {
-          // TODO: this case needs testing
-          content = message.function_call.arguments
-        }
-
-        const [numTokensContent, numTokensRole, numTokensName] =
-          await Promise.all([
-            this.getNumTokens(content),
-            this.getNumTokens(message.role),
-            message.name
-              ? this.getNumTokens(message.name).then((n) => n + tokensPerName)
-              : Promise.resolve(0)
-          ])
-
-        const numTokens =
-          tokensPerMessage + numTokensContent + numTokensRole + numTokensName
-
-        numTokensTotal += numTokens
-        return numTokens
-      },
-      {
-        concurrency: 8
-      }
-    )
-
-    // TODO
-    numTokensTotal += 3 // every reply is primed with <|start|>assistant<|message|>
-
-    return { numTokensTotal, numTokensPerMessage }
+      model: this._model,
+      getNumTokens: this.getNumTokens.bind(this)
+    })
  }
 }
--- a/src/llms/llm-utils.ts
+++ b/src/llms/llm-utils.ts
@ -1,9 +1,84 @@
+import pMap from 'p-map'
 import { zodToJsonSchema } from 'zod-to-json-schema'

 import * as types from '@/types'
 import { BaseTask } from '@/task'
+import { getModelNameForTiktoken } from '@/tokenizer'
 import { isValidTaskIdentifier } from '@/utils'

+// TODO: this needs work + testing
+// TODO: move to isolated module
+export async function getNumTokensForChatMessages({
+  messages,
+  model,
+  getNumTokens,
+  concurrency = 8
+}: {
+  messages: types.ChatMessage[]
+  model: string
+  getNumTokens: (text: string) => Promise<number>
+  concurrency?: number
+}): Promise<{
+  numTokensTotal: number
+  numTokensPerMessage: number[]
+}> {
+  let numTokensTotal = 0
+  let configNumTokensPerMessage = 0
+  let configNumTokensPerName = 0
+
+  const modelName = getModelNameForTiktoken(model)
+
+  // https://github.com/openai/openai-cookbook/blob/main/examples/How_to_format_inputs_to_ChatGPT_models.ipynb
+  if (modelName === 'gpt-3.5-turbo') {
+    configNumTokensPerMessage = 4
+    configNumTokensPerName = -1
+  } else if (modelName.startsWith('gpt-4')) {
+    configNumTokensPerMessage = 3
+    configNumTokensPerName = 1
+  } else {
+    // TODO
+    configNumTokensPerMessage = 4
+    configNumTokensPerName = -1
+  }
+
+  const numTokensPerMessage = await pMap(
+    messages,
+    async (message) => {
+      let content = message.content || ''
+      if (message.function_call) {
+        // TODO: this case needs testing
+        content = message.function_call.arguments
+      }
+
+      const [numTokensContent, numTokensRole, numTokensName] =
+        await Promise.all([
+          getNumTokens(content),
+          getNumTokens(message.role),
+          message.name
+            ? getNumTokens(message.name).then((n) => n + configNumTokensPerName)
+            : Promise.resolve(0)
+        ])
+
+      const numTokens =
+        configNumTokensPerMessage +
+        numTokensContent +
+        numTokensRole +
+        numTokensName
+
+      numTokensTotal += numTokens
+      return numTokens
+    },
+    {
+      concurrency
+    }
+  )
+
+  // TODO
+  numTokensTotal += 3 // every reply is primed with <|start|>assistant<|message|>
+
+  return { numTokensTotal, numTokensPerMessage }
+}
+
 export function getChatMessageFunctionDefinitionFromTask(
  task: BaseTask<any, any>
 ): types.openai.ChatMessageFunction {