🐃

2023-05-23 20:22:50 -07:00 · 2023-05-23 20:22:50 -07:00 · 2c638ca207
commit 2c638ca207
--- a/package.json
+++ b/package.json
@ -25,15 +25,18 @@
  "dependencies": {
    "@dqbd/tiktoken": "^1.0.7",
    "dotenv-safe": "^8.2.0",
+    "mustache": "^4.2.0",
    "openai-fetch": "^1.2.1",
    "p-map": "^6.0.0",
    "parse-json": "^7.0.0",
    "type-fest": "^3.10.0",
    "zod": "^3.21.4",
+    "zod-to-ts": "^1.1.4",
    "zod-validation-error": "^1.3.0"
  },
  "devDependencies": {
    "@trivago/prettier-plugin-sort-imports": "^4.1.1",
+    "@types/mustache": "^4.2.2",
    "@types/node": "^20.2.0",
    "del-cli": "^5.0.0",
    "husky": "^8.0.3",
--- a/pnpm-lock.yaml
+++ b/pnpm-lock.yaml
@ -7,6 +7,9 @@ dependencies:
  dotenv-safe:
    specifier: ^8.2.0
    version: 8.2.0
+  mustache:
+    specifier: ^4.2.0
+    version: 4.2.0
  openai-fetch:
    specifier: ^1.2.1
    version: 1.2.1
@ -22,6 +25,9 @@ dependencies:
  zod:
    specifier: ^3.21.4
    version: 3.21.4
+  zod-to-ts:
+    specifier: ^1.1.4
+    version: 1.1.4(typescript@5.0.4)(zod@3.21.4)
  zod-validation-error:
    specifier: ^1.3.0
    version: 1.3.0(zod@3.21.4)
@ -30,6 +36,9 @@ devDependencies:
  '@trivago/prettier-plugin-sort-imports':
    specifier: ^4.1.1
    version: 4.1.1(prettier@2.8.8)
+  '@types/mustache':
+    specifier: ^4.2.2
+    version: 4.2.2
  '@types/node':
    specifier: ^20.2.0
    version: 20.2.0
@ -473,6 +482,10 @@ packages:
    resolution: {integrity: sha512-jhuKLIRrhvCPLqwPcx6INqmKeiA5EWrsCOPhrlFSrbrmU4ZMPjj5Ul/oLCMDO98XRUIwVm78xICz4EPCektzeQ==}
    dev: true

+  /@types/mustache@4.2.2:
+    resolution: {integrity: sha512-MUSpfpW0yZbTgjekDbH0shMYBUD+X/uJJJMm9LXN1d5yjl5lCY1vN/eWKD6D1tOtjA6206K0zcIPnUaFMurdNA==}
+    dev: true
+
  /@types/node@20.2.0:
    resolution: {integrity: sha512-3iD2jaCCziTx04uudpJKwe39QxXgSUnpxXSvRQjRvHPxFQfmfP4NXIm/NURVeNlTCc+ru4WqjYGTmpXrW9uMlw==}
    dev: true
@ -1642,6 +1655,11 @@ packages:
    resolution: {integrity: sha512-sGkPx+VjMtmA6MX27oA4FBFELFCZZ4S4XqeGOXCv68tT+jb3vk/RyaKWP0PTKyWtmLSM0b+adUTEvbs1PEaH2w==}
    dev: true

+  /mustache@4.2.0:
+    resolution: {integrity: sha512-71ippSywq5Yb7/tVYyGbkBggbU8H3u5Rz56fH60jGFgr8uHwxs+aSKeqmluIVzM0m0kB7xQjKS6qPfd0b2ZoqQ==}
+    hasBin: true
+    dev: false
+
  /mz@2.7.0:
    resolution: {integrity: sha512-z81GNO7nnYMEhrGh9LeymoE4+Yr0Wn5McHIZMK5cfQCl+NDX08sCZgUc9/6MHni9IWuFLm1Z3HTCXu2z9fN62Q==}
    dependencies:
@ -2541,6 +2559,16 @@ packages:
    engines: {node: '>=10'}
    dev: true

+  /zod-to-ts@1.1.4(typescript@5.0.4)(zod@3.21.4):
+    resolution: {integrity: sha512-jsCg+pTNxLAdJOfW4ul+SpechdGYEJPPnssSbqWdR2LSIkotT22k+UvqPb1nEHwe/YbEcbUOlZUfGM0npgR+Jg==}
+    peerDependencies:
+      typescript: ^4.9.4 || ^5.0.2
+      zod: ^3
+    dependencies:
+      typescript: 5.0.4
+      zod: 3.21.4
+    dev: false
+
  /zod-validation-error@1.3.0(zod@3.21.4):
    resolution: {integrity: sha512-4WoQnuWnj06kwKR4A+cykRxFmy+CTvwMQO5ogTXLiVx1AuvYYmMjixh7sbkSsQTr1Fvtss6d5kVz8PGeMPUQjQ==}
    engines: {node: '>=16.0.0'}
--- a/src/llm.ts
+++ b/src/llm.ts
@ -1,5 +1,7 @@
+import Mustache from 'mustache'
 import type { SetRequired } from 'type-fest'
 import { ZodRawShape, ZodTypeAny, z } from 'zod'
+import { printNode, zodToTs } from 'zod-to-ts'

 import * as types from './types'

@ -161,16 +163,27 @@ export class OpenAIChatModelBuilder<
  override async call(
    input?: types.ParsedData<TInput>
  ): Promise<types.ParsedData<TOutput>> {
+    if (this._options.input) {
+      const inputSchema =
+        this._options.input instanceof z.ZodType
+          ? this._options.input
+          : z.object(this._options.input)
+
+      // TODO: handle errors gracefully
+      input = inputSchema.parse(input)
+    }
+
    // TODO: construct messages
+    const messages = this._messages

    const completion = await this._client.createChatCompletion({
-      model: defaultOpenAIModel, // TODO: this shouldn't be necessary
+      model: defaultOpenAIModel, // TODO: this shouldn't be necessary but TS is complaining
      ...this._options.modelParams,
-      messages: this._messages
+      messages
    })

    if (this._options.output) {
-      const schema =
+      const outputSchema =
        this._options.output instanceof z.ZodType
          ? this._options.output
          : z.object(this._options.output)
@ -178,9 +191,106 @@ export class OpenAIChatModelBuilder<
      // TODO: convert string => object if necessary
      // TODO: handle errors, retry logic, and self-healing

-      return schema.parse(completion.message.content)
+      return outputSchema.parse(completion.message.content)
    } else {
      return completion.message.content as any
    }
  }
+
+  protected async _buildMessages(text: string, opts: types.SendMessageOptions) {
+    const { systemMessage = this._systemMessage } = opts
+    let { parentMessageId } = opts
+
+    const userLabel = USER_LABEL_DEFAULT
+    const assistantLabel = ASSISTANT_LABEL_DEFAULT
+
+    const maxNumTokens = this._maxModelTokens - this._maxResponseTokens
+    let messages: types.openai.ChatCompletionRequestMessage[] = []
+
+    if (systemMessage) {
+      messages.push({
+        role: 'system',
+        content: systemMessage
+      })
+    }
+
+    const systemMessageOffset = messages.length
+    let nextMessages = text
+      ? messages.concat([
+          {
+            role: 'user',
+            content: text,
+            name: opts.name
+          }
+        ])
+      : messages
+    let numTokens = 0
+
+    do {
+      const prompt = nextMessages
+        .reduce((prompt, message) => {
+          switch (message.role) {
+            case 'system':
+              return prompt.concat([`Instructions:\n${message.content}`])
+            case 'user':
+              return prompt.concat([`${userLabel}:\n${message.content}`])
+            default:
+              return prompt.concat([`${assistantLabel}:\n${message.content}`])
+          }
+        }, [] as string[])
+        .join('\n\n')
+
+      const nextNumTokensEstimate = await this._getTokenCount(prompt)
+      const isValidPrompt = nextNumTokensEstimate <= maxNumTokens
+
+      if (prompt && !isValidPrompt) {
+        break
+      }
+
+      messages = nextMessages
+      numTokens = nextNumTokensEstimate
+
+      if (!isValidPrompt) {
+        break
+      }
+
+      if (!parentMessageId) {
+        break
+      }
+
+      const parentMessage = await this._getMessageById(parentMessageId)
+      if (!parentMessage) {
+        break
+      }
+
+      const parentMessageRole = parentMessage.role || 'user'
+
+      nextMessages = nextMessages.slice(0, systemMessageOffset).concat([
+        {
+          role: parentMessageRole,
+          content: parentMessage.text,
+          name: parentMessage.name
+        },
+        ...nextMessages.slice(systemMessageOffset)
+      ])
+
+      parentMessageId = parentMessage.parentMessageId
+    } while (true)
+
+    // Use up to 4096 tokens (prompt + response), but try to leave 1000 tokens
+    // for the response.
+    const maxTokens = Math.max(
+      1,
+      Math.min(this._maxModelTokens - numTokens, this._maxResponseTokens)
+    )
+
+    return { messages, maxTokens, numTokens }
+  }
+
+  protected async _getTokenCount(text: string) {
+    // TODO: use a better fix in the tokenizer
+    text = text.replace(/<\|endoftext\|>/g, '')
+
+    return tokenizer.encode(text).length
+  }
 }
--- a/src/temp.ts
+++ b/src/temp.ts
@ -19,10 +19,20 @@ async function main() {

  console.log(ex0)

-  const ex1 = await $.gpt4(`give me fake data conforming to this schema`)
-    .output(z.object({ foo: z.string(), bar: z.number() }))
-    // .retry({ attempts: 3 })
-    .call()
+  const ex1 = await $.gpt4(
+    `give me fake data conforming to this schema`
+  ).output(z.object({ foo: z.string(), bar: z.number() }))
+  // .retry({ attempts: 3 })
+  // .call()
+
+  const getBoolean = $.gpt4(`give me a single boolean value {{foo}}`)
+    .input(z.object({ foo: z.string() }))
+    .output(z.boolean())
+
+  await Promise.all([
+    getBoolean.call({ foo: 'foo' }),
+    getBoolean.call({ foo: 'bar' })
+  ])

  console.log(ex1)
 }