It's about 4 charcters per token. So just over 1 token per word. I just round to...

MacsHeadroom on March 12, 2023 | parent | context | favorite | on: Llama.cpp: Port of Facebook's LLaMA model in C/C++...

It's about 4 charcters per token. So just over 1 token per word. I just round to 1 token per word since text most people generate does not use larger words and because larger common words are still encoded as one token (e.g. HackerNews is probably one token despite being 10 characters).

Taek on March 12, 2023 [–]

I typically see people claim 2-3 tokens per word.