本文对谷歌年度盘点
作者文章归档:王半仙
发表评论
82 views
发表评论
68 views
FACTS Grounding 谷歌和 Kaggle 推出的 AI 模型的真实性和基础推理能力
HHEM Leaderboard 幻觉测试排名
HLE:LLMs 基准测试|人类终极考试
LiveBench:动态测试|防作弊 LLMs 榜单
大模型斗兽场 LLMs 排名|ELO 评分系统
Artificial Analysis 人工智能分析综合指数,包含 7 项评估:MMLU-Pro、GPQA Diamond、人类最后考试、LiveCodeBench、SciCode、AIME、MATH-500
发表评论
69 views
量子:量子是组成物质和能量的离散的基本单位。有别于传统经典物理中的概念,在微观世界中物质与能量会从一个个连续的量变成一个个离散的量(就像人走上台阶一样,人只能站在整数台阶上,而不能站在第 1.6 个或 2.4 个台阶上,因为不稳定)。这种离散的物理学概念就是量子~
基础公设
量子力学的五个基础公设
- 态矢量公设/量子态公设:量子系统的状态由希尔伯特空间中的态矢量描述,态矢量视为系统的“信息载体”,包含了关于系统所有可能测量结果的信息;波函数是态矢量的一种具体表示
- 可观察量公设:每个可观察物理量(
发表评论
69 views
英文标题:AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithm
发表评论
57 views
发表评论
62 views
提示词框架
RTF(Role-Task-Format)框架
- Role 角色设定:为 AI 赋予一个虚拟身份或专业视角,引导其用特定角色思维回答问题
- Task 任务指令:清晰定义AI需要完成的具体动作和内容要求,避免模糊指令或用词
- Format 输出格式:指定AI结果的结构化呈现方式,比如格式、排版或特殊规范
用 XML 格式包装提示词
原始提示词:
你是一个资深的文学家,你正在阅读一篇文章,请仔细阅读,然后基于文章的内容,按如下格式返回总结:
## 文章概览
[对文章的整
发表评论
59 views
MCP 模型上下文协议
- 由 Anthropic 提出,用于标准化 LLMs 与外部系统交互的接口
- 开发者能以统一的方式将大模型对接到各种数据源和工具
目前 MCP 协议已得到了广泛的生态支持,兼具通用性和灵活性
MCP 的两种模式:
- Stdio:主要用在本地服务上,操作本地的软件或者本地的文件
- SSE:主要用在远程服务上,比如基于 API 访问谷歌邮件,谷歌日历等
MCP 工具投毒
工具投毒攻击(Tool Poisoning Attack,简称 TPA),主要
发表评论
465 views
手机监听的几种方式:
- 获取麦克风权限窃听,高成本低收益
- 基于加速度计/陀螺仪的窃听,值得警惕与关注
- 输入法软件信息泄露,识别并上传关键文本
- 跨平台营销推荐,难以规避的信息泄露
- 幸存者偏差,偶然情况导致的窃听错觉
麦克风窃听
获取麦克风权限用于窃听的方法,在经济成本和技术能力层面都不现实
根据字节的一篇科普文章可知
- 当前大规模数据的非实时语音识别服务的主流价格约为0.6~1元/小时
- 如果每天偷听一位用户16小时(除去8小时睡眠时间),单日成本约为9.6—16元/人,每年成本约为3504—5840元/人,同时用户日常对话中真正具有广
发表评论
351 views
定义与诊断
过敏性休克
- 一种严重、可能危及生命的过敏反应,通常由接触药物、食物或毒液引起
- 可影响多个身体系统,如皮肤、呼吸道、消化系统和心血管系统
- 其重要性在于其突然发作和迅速进展
- 如果不及时有效治疗,可能导致休克、呼吸困难和甚至死亡
美国过敏性休克的终身患病率估计在 0.05%至 2%之间
过敏性休克的临床标准:美国国立过敏和传染病研究所(NIAID)金标准
- 标准 1:急性发作的疾病(从几分钟到几个小时),伴随皮肤、黏膜组织或两者的受累(例如,全身性荨麻疹、瘙痒或潮红、嘴唇-舌头-悬雍垂肿胀)并且至少有以下之一: a. 呼吸困难(例如,呼
发表评论
339 views