LLMNotes on Qwen1.5Qwen在24年1月份发布了Qwen1.5,包含 0.5B, 1.8B, 4B, 7B, 14B, 32B, 72B, 以及 110B 6个size,还有一个MoE模型。
LLMNotes on YaRNYaRN (Yet Another RoPE extentionN method) 时23年9月EleutherAI等提出来的一个扩展LLM上下文长度的方法,后来被Qwen系列模型所应用。