Text this: An evaluation of tokenizers on domain specific text

  _  __   _    _    __   __     ___      _  _   
 | |/ // | || | ||  \ \\/ //   / _ \\   | \| || 
 | ' //  | || | ||   \   //   | / \ ||  |  ' || 
 | . \\  | \\_/ ||   / . \\   | \_/ ||  | .  || 
 |_|\_\\  \____//   /_//\_\\   \___//   |_|\_|| 
 `-` --`   `---`    `-`  --`   `---`    `-` -`