✈️ Gate 广场【Gate Travel 旅行分享官召集令】
广场家人们注意啦!Gate Travel 已经上线~ 机票+酒店一站式预订,还能用加密货币直接付款 💸
所以说,你的钱包和你的旅行梦终于可以谈恋爱了 😎 💕
现在广场开启 #GateTravel旅行分享官# 活动,邀你来秀旅行灵感 & 使用体验!💡
🌴 参与方式:
1️⃣ 在【广场】带话题 #Gate Travel 旅行分享官# 发帖
2️⃣ 你可以:
你最想用 Gate Travel 去的目的地(私藏小岛 or 网红打卡点都行)
讲讲用 Gate Travel 订票/订酒店的奇妙体验
放放省钱/使用攻略,让大家省到笑出声
或者直接写一篇轻松的 Gate Travel 旅行小故事
📦 奖励安排,走起:
🏆 优秀分享官(1 名):Gate 旅行露营套装
🎖️ 热门分享官(3 名):Gate 旅行速干套装
🎉 幸运参与奖(5 名):Gate 国际米兰旅行小夜灯
*海外用户 旅行露营套装 以 $100 合约体验券,旅行速干套装 以 $50 合约体验券折算,国际米兰旅行小夜灯以 $30合约体验券折算。
📌 优质内容将有机会得到官方账号转发翻牌提升社区曝光!
📌 帖文将综合互动量、内容丰富度和创意评分。禁止小号刷贴,原创分享更容易脱颖而出!
🕒 8月20 18:00 - 8月28日 24:00 UTC+
代币突破攻击通过单个字符绕过LLM安全保护
首页新闻* 研究人员已识别出一种名为TokenBreak的新方法,该方法通过改变文本输入中的单个字符,绕过大型语言模型(LLM)的安全性和管理。
研究团队在他们的报告中解释说,“TokenBreak攻击针对文本分类模型的代币化策略,以诱导假阴性,使最终目标容易受到保护模型旨在防止的攻击。” 代币化在语言模型中至关重要,因为它将文本转化为可以被算法映射和理解的单元。被操纵的文本可以通过LLM过滤器,触发与输入未被更改时相同的响应。
HiddenLayer发现TokenBreak适用于使用BPE (字节对编码)或WordPiece分词的模型,但不影响基于Unigram的系统。研究人员表示,*“了解底层保护模型的家族及其分词策略对于理解您对该攻击的敏感性至关重要。”*他们建议使用Unigram分词器,教导过滤模型识别分词技巧,并查看日志以寻找操控迹象。
这一发现是在HiddenLayer之前的研究基础上得出的,该研究详细说明了如何使用Model Context Protocol (MCP)工具,通过在工具的函数中插入特定参数来泄露敏感信息。
在一项相关的发展中,Straiker AI 研究团队表明,“年鉴攻击”——使用反义词对不良内容进行编码——可以欺骗来自 Anthropic、DeepSeek、Google、Meta、Microsoft、Mistral AI 和 OpenAI 等公司的聊天机器人产生不良响应。安全研究人员解释说,这些技巧会通过过滤器,因为它们类似于普通消息,并利用模型如何重视上下文和模式完成,而不是意图分析。
以前的文章: