chatgpt-api/src/tokenizer.ts

9 wiersze
214 B
TypeScript

import { get_encoding } from '@dqbd/tiktoken'
// TODO: make this configurable
const tokenizer = get_encoding('cl100k_base')
export function encode(input: string): Uint32Array {
return tokenizer.encode(input)
}