智源 【BBuf的CUDA笔记】十,Linear Attention的cuda kernel实现解析 欢迎来 https://github.com/BBuf/how-to-optim-algorithm-in…
智源 再看大模型长文本性能如何评估:金融领域FinLongEval及L-EVAL多任务评估数据构造 今天是2023年12月25日,星期一,2023年最后一周,北京,天气晴。 关于长文本评估,目前陆陆续续已经…