💇

2023-05-23 22:28:38 -07:00 · 2023-05-23 22:28:38 -07:00 · 2afaf4d9ad
commit 2afaf4d9ad
--- a/package.json
+++ b/package.json
@ -29,6 +29,7 @@
    "openai-fetch": "^1.2.1",
    "p-map": "^6.0.0",
    "parse-json": "^7.0.0",
+    "ts-dedent": "^2.2.0",
    "type-fest": "^3.10.0",
    "zod": "^3.21.4",
    "zod-to-ts": "^1.1.4",
--- a/pnpm-lock.yaml
+++ b/pnpm-lock.yaml
@ -19,6 +19,9 @@ dependencies:
  parse-json:
    specifier: ^7.0.0
    version: 7.0.0(typescript@5.0.4)
+  ts-dedent:
+    specifier: ^2.2.0
+    version: 2.2.0
  type-fest:
    specifier: ^3.10.0
    version: 3.10.0(typescript@5.0.4)
@ -2361,6 +2364,11 @@ packages:
    engines: {node: '>=12'}
    dev: true

+  /ts-dedent@2.2.0:
+    resolution: {integrity: sha512-q5W7tVM71e2xjHZTlgfTDoPF/SmqKG5hddq9SzR49CH2hayqRKJtQ4mtRlSxKaJlR/+9rEM+mnBHf7I2/BQcpQ==}
+    engines: {node: '>=6.10'}
+    dev: false
+
  /ts-interface-checker@0.1.13:
    resolution: {integrity: sha512-Y/arvbn+rrz3JCKl9C4kVNfTfSm2/mEp5FSz5EsZSANGPSlQrpRI5M4PKF+mJnE52jOO90PnPSc3Ur3bTQw0gA==}
    dev: true
--- a/src/index.ts
+++ b/src/index.ts
@ -1 +1,2 @@
-export * from './utils'
+export * from './llm'
+export * from './tokenizer'
--- a/src/llm.ts
+++ b/src/llm.ts
@ -1,4 +1,5 @@
 import Mustache from 'mustache'
+import { dedent } from 'ts-dedent'
 import type { SetRequired } from 'type-fest'
 import { ZodRawShape, ZodTypeAny, z } from 'zod'
 import { printNode, zodToTs } from 'zod-to-ts'
@ -173,8 +174,18 @@ export class OpenAIChatModelBuilder<
      input = inputSchema.parse(input)
    }

-    // TODO: construct messages
    const messages = this._messages
+      .map((message) => {
+        return {
+          ...message,
+          content: message.content
+            ? Mustache.render(dedent(message.content), input).trim()
+            : ''
+        }
+      })
+      .filter((message) => message.content)
+
+    // TODO: filter/compress messages based on token counts

    const completion = await this._client.createChatCompletion({
      model: defaultOpenAIModel, // TODO: this shouldn't be necessary but TS is complaining
@ -196,101 +207,4 @@ export class OpenAIChatModelBuilder<
      return completion.message.content as any
    }
  }
-
-  protected async _buildMessages(text: string, opts: types.SendMessageOptions) {
-    const { systemMessage = this._systemMessage } = opts
-    let { parentMessageId } = opts
-
-    const userLabel = USER_LABEL_DEFAULT
-    const assistantLabel = ASSISTANT_LABEL_DEFAULT
-
-    const maxNumTokens = this._maxModelTokens - this._maxResponseTokens
-    let messages: types.openai.ChatCompletionRequestMessage[] = []
-
-    if (systemMessage) {
-      messages.push({
-        role: 'system',
-        content: systemMessage
-      })
-    }
-
-    const systemMessageOffset = messages.length
-    let nextMessages = text
-      ? messages.concat([
-          {
-            role: 'user',
-            content: text,
-            name: opts.name
-          }
-        ])
-      : messages
-    let numTokens = 0
-
-    do {
-      const prompt = nextMessages
-        .reduce((prompt, message) => {
-          switch (message.role) {
-            case 'system':
-              return prompt.concat([`Instructions:\n${message.content}`])
-            case 'user':
-              return prompt.concat([`${userLabel}:\n${message.content}`])
-            default:
-              return prompt.concat([`${assistantLabel}:\n${message.content}`])
-          }
-        }, [] as string[])
-        .join('\n\n')
-
-      const nextNumTokensEstimate = await this._getTokenCount(prompt)
-      const isValidPrompt = nextNumTokensEstimate <= maxNumTokens
-
-      if (prompt && !isValidPrompt) {
-        break
-      }
-
-      messages = nextMessages
-      numTokens = nextNumTokensEstimate
-
-      if (!isValidPrompt) {
-        break
-      }
-
-      if (!parentMessageId) {
-        break
-      }
-
-      const parentMessage = await this._getMessageById(parentMessageId)
-      if (!parentMessage) {
-        break
-      }
-
-      const parentMessageRole = parentMessage.role || 'user'
-
-      nextMessages = nextMessages.slice(0, systemMessageOffset).concat([
-        {
-          role: parentMessageRole,
-          content: parentMessage.text,
-          name: parentMessage.name
-        },
-        ...nextMessages.slice(systemMessageOffset)
-      ])
-
-      parentMessageId = parentMessage.parentMessageId
-    } while (true)
-
-    // Use up to 4096 tokens (prompt + response), but try to leave 1000 tokens
-    // for the response.
-    const maxTokens = Math.max(
-      1,
-      Math.min(this._maxModelTokens - numTokens, this._maxResponseTokens)
-    )
-
-    return { messages, maxTokens, numTokens }
-  }
-
-  protected async _getTokenCount(text: string) {
-    // TODO: use a better fix in the tokenizer
-    text = text.replace(/<\|endoftext\|>/g, '')
-
-    return tokenizer.encode(text).length
-  }
 }
--- a/src/temp.ts
+++ b/src/temp.ts
@ -19,11 +19,10 @@ async function main() {

  console.log(ex0)

-  const ex1 = await $.gpt4(
-    `give me fake data conforming to this schema`
-  ).output(z.object({ foo: z.string(), bar: z.number() }))
-  // .retry({ attempts: 3 })
-  // .call()
+  const ex1 = await $.gpt4(`give me fake data conforming to this schema`)
+    .output(z.object({ foo: z.string(), bar: z.number() }))
+    // .retry({ attempts: 3 })
+    .call()

  const getBoolean = $.gpt4(`give me a single boolean value {{foo}}`)
    .input(z.object({ foo: z.string() }))
--- a/src/tokenizer.ts
+++ b/src/tokenizer.ts
@ -0,0 +1,5 @@
+import { encoding_for_model } from '@dqbd/tiktoken'
+
+export function getTokenizerForModel(model: string) {
+  return encoding_for_model(model as any)
+}
--- a/src/utils.ts
+++ b/src/utils.ts
@ -1,39 +0,0 @@
-import dotenv from 'dotenv-safe'
-import { OpenAIClient } from 'openai-fetch'
-import { z } from 'zod'
-import { fromZodError } from 'zod-validation-error'
-
-dotenv.config()
-
-interface Temp {
-  contentType: string
-}
-
-async function main() {
-  const openai = new OpenAIClient({ apiKey: process.env.OPENAI_API_KEY })
-
-  const outputSchema = z.object({})
-
-  const res = await openai.createChatCompletion({
-    model: 'gpt-4',
-    messages: [
-      {
-        role: 'system',
-        content: ''
-      }
-    ]
-  })
-
-  const out = await infer('give me a single boolean value', z.boolean(), {})
-}
-
-async function infer<T = any>(
-  prompt: string,
-  schema: z.ZodType<T>,
-  { retry }
-): Promise<T> {}
-
-main().catch((err) => {
-  console.error('error', err)
-  process.exit(1)
-})