阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆
基于全新混合式架构,模型在较小的参数规模下可实现更高的准确率与卓越的性能
此次发布凸显阿拉伯联合酋长国加快挺进高性能语言模型赛道,全面参与全球人工智能领先力量竞争的战略布局
Technology Innovation Institute(TII)——阿布扎比先进技术研究委员会(Advanced Technology Research Council,ATRC)旗下的应用研究机构——正式发布Falcon-H1 Arabic。这是一款基于混合式Mamba-Transformer架构全新打造的大型语言模型,标志着对以往Transformer架构路线的根本性突破。凭借卓越的综合性能,Falcon-H1 Arabic已在Open Arabic LLM Leaderboard(OALL)上确立其作为当前全球表现最优阿拉伯语AI模型的领先地位。
这一里程碑式的进展使Falcon-H1 Arabic确立为目前市场上表现最为领先的阿拉伯语人工智能模型。该模型在参数规模显著更小的情况下,依然全面超越多款体量数倍于己的同类模型,在准确率、上下文理解能力及语言表征等核心维度上均达到业界最先进水平。
阿联酋总统顾问、先进技术研究委员会(ATRC)秘书长Faisal al Bannai阁下表示:“Falcon-H1 Arabic彰显了我们持续推进的战略承诺,即进一步巩固阿拉伯联合酋长国作为全球先进技术与负责任人工智能枢纽的领先地位。通过打造真正契合本地区语言与文化特征的模型,我们正在推动更具可及性、更贴近实际、并能在社会层面产生深远影响的创新实践。这一成果充分印证了TII在人才储备与科研实力方面的深厚积淀。”
在今年早些时候发布的Falcon-Arabic系列模型获得广泛积极反响、并清晰反映出市场与开发者社区对高质量阿拉伯语大型语言模型的迫切需求之后,TII进一步深化相关研发,推出全新的Falcon-H1 Arabic模型家族。该系列提供3B、7B及34B三种参数规模,旨在灵活适配不同算力条件与多元化应用场景。Falcon-H1 Arabic在数据质量、阿拉伯语方言覆盖、长上下文处理稳定性以及数学推理能力等方面实现显著提升,使模型在实际应用中展现出更高的准确性、可靠性与语境感知能力,全面提升对阿拉伯语的理解深度与应用价值。
TII首席执行官Najwa Aaraj博士表示:“Falcon-H1 Arabic的推出,建立在我们多年持续推进阿拉伯语人工智能基础研究的坚实成果之上,并精准回应了包括开发者和企业在内的社区核心需求。通过在模型架构、数据质量及长上下文推理能力方面不断迭代升级,我们正在构建关键性技术能力,释放阿拉伯语在教育、医疗、治理、企业等多个领域的全新应用潜能。该模型是我们履行使命的重要里程碑——即打造世界一流的人工智能技术,既服务本地区发展,也为全球进步贡献力量。”
基准测试结果
在OALL Leaderboard这一覆盖多维度阿拉伯语理解与推理能力的权威评测榜单中,Falcon-H1 Arabic以全面领先的性能表现脱颖而出,清晰确立其行业领跑地位:
- 3B模型:平均得分达61.87%,较主流4B级竞品高出10个百分点,显著领先包括Microsoft的Phi-4 Mini在内的同级模型。
- 7B模型:平均得分71.47%,全面超越所有约10B参数规模模型,包括卡塔尔的Fanar-1-9B以及沙特阿拉伯的HUMAIN ALLaM 7B。
- 34B模型:得分高达75.36%,性能表现进一步突破,甚至超越多款70B以上参数规模的超大模型,包括中国的Qwen2.5 72B以及META的Llama-3.3 70B。
除在OALL榜单上展现领先优势外,Falcon-H1 Arabic系列模型在多项更具针对性的专业基准测试中同样取得卓越成绩,包括:(i)3LM,用于评估STEM领域的推理能力;(ii)ArabCulture,用于衡量文化与语境理解水平;以及(iii)AraDice,专注于阿拉伯语方言理解与识别能力。
综合各项评测结果,此次成果标志着阿拉伯语人工智能领域迎来关键性突破。Falcon-H1 Arabic不仅在通用及专项基准测试中全面超越多款参数规模数倍于己的模型,更在语言理解深度、推理能力与计算效率等核心维度上实现质的飞跃,树立了全新的行业标杆。由此,Falcon-H1 Arabic确立为迄今开发完成的最具能力与通用性的阿拉伯语大型语言模型体系。
TII人工智能与数字研究中心(Artificial Intelligence and Digital Research Centre,AIDRC)首席研究员Hakim Hacid 表示:“这一模型充分体现了我们打造阿拉伯语人工智能的核心理念——不仅在技术上更为先进,更能够在真实应用场景中切实发挥价值。通过在效率、理解深度以及语言覆盖范围上的持续提升,我们正在赋能人工智能系统,更好地支持本地区的机构、开发者与社区发展。”
该模型在上下文处理能力上实现重大跃升,支持最高256K tokens的超长上下文窗口,使模型能够在单次交互中高效处理大规模信息内容。实际应用中,用户可对冗长的法律文本、医疗记录、学术论文或企业级知识库进行连续、完整的分析,而不会出现语境中断或信息遗失——这一能力在此前同等规模的模型中尚属首次实现。
自2023年以来,TII的Falcon系列人工智能模型持续在多项区域性与全球性基准评测中位居首位。此次,Falcon-H1 Arabic在不同参数规模下全面领跑Open Arabic LLM Leaderboard,进一步巩固其领先优势。这一系列成绩充分体现了TII在打造具备主权属性、并可在全球最高技术舞台上竞争的人工智能能力方面的卓越实力,同时也有力推动了阿布扎比及更广泛的阿拉伯联合酋长国在阿拉伯语人工智能研究与创新领域的国际领导地位。
新一代模型现已通过TII对外开放的公共平台正式上线,用户可在其交互式体验环境(playground)中进行访问与试用。
来源:AETOSWire

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆(图片来源:AETOSWire)

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆(图片来源:AETOSWire)
