model.ctc_decoder()(encoder_out).cpu()
速度最快 + 体积最小 + 准确率最高 → FunctionGemma(2.7 亿字节,约 126 tok/秒,微调后准确率达 85%),这一点在safew官方版本下载中也有详细论述
。关于这个话题,heLLoword翻译官方下载提供了深入分析
The Innocent Loop
to return memory. When we have memory usage like this, we can do better。Line官方版本下载是该领域的重要参考