大模型长度扩展综述:从直接外推ALiBi、插值PI、NTK-aware插值(Meta称之为RoPE ABF)、YaRN到S2-Attention
前言 23下半年,我全力推动我司『七月在线』大模型项目团队的组建,我虽兼管整个项目团队,但为了并行多个项目,最终分成了三个项目组,
【AI大模型:前沿】44、大模型+机器人:从自动化工具到通用智能体的技术革命与应用全景
当大模型的认知能力与机器人的物理执行能力相结合,一种全新的智能形态——“具身智能体”正逐步走出实验室。传统机器人被局限在预设场景(如流水线焊接),而大模型赋予它们理解模糊指令、处理突发状况、甚至零样本执行新任务的能力。 本文将系统解析“大
以高质量数据为基石:OpenCSG 助力 MiniCPM4 实现端侧大模型的性能与效率双突破
以高质量数据为基石:OpenCSG 助力 MiniCPM4 实现端侧大模型的性能与效率双突破顶尖的开源AI研究团队 OpenBMB 在其最新的技术报告中发布了备受瞩目的端侧大模型 MiniCPM4。该模型旨在以极高的计
微调数据格式详解:适配任务、模型与生态的最佳实践
一、引言:微调在垂直领域的重要性 通用大模型虽具备强大的基础能力,却在医疗、金融、法律等专业场景中暴露出明显短板:术语混淆(如将“处方药”误作“非处方药”)、风格不符(如法律回答缺失法条引用)、逻辑偏差(如金融分析忽略关键指标)等问题频
Python从入门到快速精通模型算法(六十):人工智能和机器学习概述
目录 基本概念 监督学习和非监督学习 特征向量和特征工程 距离度量 机器学习的定义和应用领域 机器学习实施步骤 Scikit-learn介绍 所谓“人工智能”通常是泛指让机器具有像人一样的智慧的技术,其目
微PE官网都该看看的技术:用U盘启动大模型推理环境?
用U盘启动大模型推理环境:微PE式AI沙箱的崛起你有没有想过,像使用微PE工具箱那样,插上一个U盘就能在任何电脑上跑起Qwen-72B的推理?这不是科
微PE官网之外的技术延伸:用U盘装系统不如跑个TTS模型
微PE官网之外的技术延伸:用U盘装系统不如跑个TTS模型在不少人的印象里,U盘启动盘的使命就是重装系统、修复引导、拷贝数据——一个沉默的工具,一次性的救援手段。但你有没有想
【雷达检测】基于matlab Swerling目标模型的雷达信号检测【含Matlab源码 14709期】含报告
💥💥💥💥💥💥💞💞💞&am
一步到位:适合初学者的Adobe Flash Player中的SWF文件部署策略
小白也能懂的AIGlasses_for_navigation部署指南 你是不是觉得AI、目标检测、模型部署这些词听起来就很高深,感觉离自己很远?别担心,今天我要带你体验一个特别有意思的AI应用——AIGlasses_for_n
Qwen2.5-7B-Instruct助力STM32F103C8T6开发者突破技术瓶颈:实例教程
Qwen2.5-7B-Instruct在嵌入式系统中的应用:STM32F103C8T6案例 1. 为什么要在STM32上运行大模型 很多人第一次听到“在STM32上跑大模型”时都会愣一下——这颗只有20KB RAM、6
离线也精彩:详解如何使用GGUF模型在本地环境实现Ollama的顺畅运行
离线部署大模型的终极实践:Ollama与GGUF模型深度整合指南 在当前的AI应用浪潮中,将大型语言模型部署到本地环境,正从一个技术极客的探索,转变为许多开发者和企业保障数据隐私、实现稳定服务、进行深度定制的刚性需求。想象一下
超越训练数据边界:GPT与零样学习的深度对话
GPT模型 Paper: GPT-1 GPT-1是OpenAI在论文《Improving Language Understanding by Generative Pre-Training》中提出的生成式预训练
参数量级激增:解密175B与1.8T参数下的GPT3.5与GPT4
1 ChatGPT概述 1.1 what is chatGPT ChatGPT (Generative Pre-Trained Transformer) 是由OpenAI团队与2022年11月基于GPT-3.5 (目前
GPT进阶指南:一步到位从GPT-1走到GPT-4
【ChatGPT】GPT 模型的发展历史:从 GPT-1 到 GPT-2 到 GPT-3 到 GPT-4目录1. 引言 自然语言处理(NLP)是人工智能领域的一个重要方向,旨在让计算机能够理解和生成
从GPT基础到GPT3大突破:揭秘Adobe Flash与AI融合
every blog every motto:Although the world is full of suffering, it is full also of the overcoming of it 0.
Hunyuan-MT-7B对决WMT25:寻找30项第一的关键因素和制胜策略
Hunyuan-MT-7B对比测试:WMT25 30项第一的秘诀 一台RTX 4080显卡,就能跑出世界顶级的翻译效果。本文将带你深入拆解腾讯混元Hunyuan-MT-7B翻译模型,看看这个70亿参数的“小
深度学习实战:火焰与烟雾的自动识别
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰
火焰检测新纪元:YOLOv11实战烟雾与火焰识别指南
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰
火眼金睛:YOLOv11实战解析烟雾与火焰的智能检测
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰
Swift-All小白教程:快速部署大模型,解决环境配置难题
Swift-All小白教程:快速部署大模型,解决环境配置难题 你是不是刚接触大模型,被各种复杂的安装命令、环境依赖、版本冲突搞得头大?是不是想快速体验一下大模型的能力,却卡在第一步的部署上?或者,你听说过LoRA微调、量化部署
发表评论