总是半途而废？一切可能是最好的安排--粉丝服务平台-粉丝头条-fensifuwu.com

总是半途而废？一切可能是最好的安排

科技 11-08 来源：中科院物理所

认真阅读下面的文章，并思考文末互动提出的问题，严格按照 互动：你的答案 格式在评论区留言，就有机会获得由电子工业出版社提供的优质科普书籍《现代科研指北》

人生中一个巨大的难题就是面对困难选择何时退出。是要坚守当前正在减少的回报，还是立刻退出再寄希望于在别处获得更丰厚的回报？对于挖金矿来说，无论哪一个金矿都会有开矿成本不足以支持金子产出的时刻，一旦到达了这一刻，就应该退出寻找新矿。

捕食灌木上毛毛虫的鸟也会遇到类似的情况，有一时刻鸟获得的能量无法支持它寻找到更多的毛毛虫，也就是退出转战其他灌木的时刻；对于蜜蜂，承载花粉消耗的能量无法抵过花粉本身提供的能量时，便是停止收集花粉、飞回蜂巢的时刻。

1976年美国生态学家埃里克·查诺夫（Eric Charnov）提出了边际价值理论（marginal value theorem），总结了这样一个数学化秘诀，来精确描述获得最大回报再退出的时刻。不仅如此，边际价值理论的应用非常广泛，从引出最佳觅食理论到描述大脑处理信息的过程。本质上，边际价值理论在不考虑支出和收益本质的情况下，提供了最大化每一份支出所获得收益的一般策略。

它选择下一顿美餐的地点不能太远。图源Greyson Orlando狩猎的瓢虫

瓢虫的食物是蚜虫，不过瓢虫捕食蚜虫的过程更像是人类徒手吃龙虾的过程，因为蚜虫的外壳（外骨骼）对于瓢虫来说就像是龙虾壳对于人类一样难以穿透。无论是哪种情况，在最初享用完最多汁的部分之后，瓢虫和人都需要花费越来越多的精力来获得更多的食物。人类面对的难题是何时停下来转向另一道菜；而瓢虫也差不多，它得决定选择放弃当前这只蚜虫而寻找另一只的时刻。

如果瓢虫太早放弃一只蚜虫，那么它就会浪费掉容易到嘴的食物；又或者它太晚放弃，那么太多的力气就会用于获得越来越少的食物，但其实这些食物往往很容易通过找到其他蚜虫来获得。那么就会存在一个不早不晚放弃的“黄金时间”。为了求出黄金时间，需要对瓢虫的进食行为进行更细致的测试。

蚜虫类似于龙虾的特性意味着，如果一只瓢虫独自捕食蚜虫的话，那么随着进食时间的增加，进食的重量也会增加，如下图的数据点所示。（数据来源于发表于1978年的关于最佳觅食理论的经典论文，这是我们瓢虫示例的启发。）

t分钟后从蚜虫进食的质量（黑点），通过一个奖励函数E(t)（黑色曲线）拟合

这些数据点可以拟合成一条奖励函数曲线E(t)，，这只瓢虫对应的a=10.43，b=0.0245. 我们利用这个奖励函数可以定义两个重要的量：

1.瞬时奖励率，即单位周期时间内获得的能量（例如每分钟获得的卡路里数）。

2.过程平均奖励率（后文称平均奖励率），，是捕食到蚜虫后t分钟获得的累计食物质量除以寻找该蚜虫的搜索时间T和吃蚜虫所用的时间t之和。

这两个量具有相当直观的几何解释。下面的图利用的也是上面那只瓢虫的奖励数据，展示了在时间T之后寻找到食物的累计奖励量E(t)。

图中的黑色曲线代表奖励函数E(t)，曲线上的斜率代表瞬时回报率r(t)，红色虚线的斜率则代表平均回报率R(t)。这张图中的瓢虫放弃得太早了。

在蚜虫被发现后的时刻t，我们可以定义一个以(T+t)、E(t)（黑色垂直虚线）为直角边、红色虚线为斜边的直角三角形，而斜边的斜率为E(t)/(T+t)，即平均奖励率R(t)。那么求平均奖励率最大值的问题相当于求红色虚线斜率最大值。那么，什么情况下可以使红色虚线斜率最大呢？

如果像上面的图中那样，进食时间只有t=10分钟时，斜率还比较小，延迟放弃的时间可以增加斜率；如果它晚10分钟放弃，会获得更高的平均奖励率。

这张图中它又放弃得太晚了。

而对于上图来说，进食时间t达到55分钟时的斜率也很小，如果放弃得早一点，斜率也就是平均奖励率会更大。

这张图中瓢虫离开的时间刚刚好。

最终，在上一张图中，斜率终于在进食时间t为35分钟时达到最大可能值，瓢虫进食的平均奖励率达到最高时对应的最佳退出时间为进食后35分钟。

值得注意的是，这个黄金时机发生在r(t)的斜率正好和红色虚线R(t)的斜率匹配的时刻t，也就是说，黄金时机对应的就是平均奖励率和瞬时奖励率相等的时刻t，此时r(t)=R(t)。

几何中也可确定，下图中用红色虚线表示瞬时奖励率r(t)，用黑色实线表示平均奖励率R(t)。

图中红色虚线表示瞬时奖励率r(t)，黑色实线表示平均奖励率R(t)

于是我们可以认为，两条曲线相交于黄金退出时刻点，也就是r(t)=R(t)的时刻。这个几何分析也有力地证明了边际效益值理论，认为最佳退出时间是瞬时奖励率和平均奖励率相等的时刻。（这里是数学证明。）

懂得边际价值理论的瓢虫

上面的分析是基于搜寻时间T一定（常数）的假设下进行的，但合适的边际价值理论预测测试还应该涵盖不同的搜寻时间。本质上，食物较少时搜索时间相应较长，对应着进食蚜虫花费更长时间。换句话说，在一只蚜虫上花费的进食时间应当随着搜寻它花费的时间的增加而增加。这句话是一个正确而模糊的结论，事实上边际价值理论可以精准地预测进食时间如何随搜寻时间增加，如下图所示（数据仍来源于库克和科克雷尔在1978年的实验）：

如果瓢虫花费40分钟找到一只蚜虫，那么它需要花费50分钟进食（红色虚线）；如果只花费10分钟寻找则只需要28分钟进食时间（蓝色虚线）。

我们可以从图上看出，边际价值理论预测了进食蚜虫的时间随着捕猎蚜虫时间的增加而增加。如果瓢虫花费40分钟找到一只蚜虫，那么它需要花费50分钟进食（红色虚线）；如果只花费10分钟寻找则只需要28分钟进食时间（蓝色虚线）。

问题是，瓢虫实际放弃的时间和边际价值理论预测的时间一致吗？研究人员因此将蚜虫随机地散落在一个托盘上，分别测量瓢虫找到和进食每只蚜虫的时间（两人实验用的是瓢虫幼虫，不过关系不大）。

瓢虫幼虫平均捕猎时间如何影响平均进食时间：点是观测到的实验结果，黑色曲线则为边际价值理论预测的进食时间。

上图展示了实验中的瓢虫幼虫的平均进食时间如何随捕猎时间变化：瓢虫幼虫平均捕猎时间如何影响平均进食时间：点表示了观测到的实验结果，黑色曲线则为边际价值理论预测的进食时间。在多次实验后，随着蚜虫数量的减少（对应捕猎时间增加），如预测的那样，平均进食每只蚜虫的时间随捕猎时间增加（蚜虫密度减少）而增加，和上图展示的边际价值理论的预测相一致。

在这个例子中，拟合的数据和理论并非完美契合，可能是由于平均奖励率函数没有一个尖锐的峰值，所以对提早或稍晚放弃的惩罚力度相对较小。相对的，如果奖赏函数上升得更陡峭，平均奖励率就会达到更高的峰值，实验数据可能会更接近边际价值理论的预测。

动物们知道何时放弃

瓢虫捕猎蚜虫只是动物们通过找到最佳放弃时机来最大化食物摄入的众多例子之一。但同样的理论也适用于其他以高成本获取资源的情况。

大山雀的聪明头脑

大山雀会花费一些时间来寻找布满毛毛虫的灌木，找到一棵这样的灌木后大山雀刚开始可以在每分钟吃掉很多毛虫，但一段时间后，毛虫的数量变少了，所以吃的速度会变慢。鉴于回报正在减少，大山雀什么时候应该放弃这棵灌木，寻找下一棵有毛虫的灌木呢？

用上面关于瓢虫的边际价值理论分析，科学家在1977年通过实验观察到了大山雀的退出时间很好地符合边际价值理论的预测。

放弃交配

雄性粪蝇需要知道和雌性粪蝇交配的时间，这体现出了一个在即刻有保证的奖励和未来不确定但可能更大的奖励之间的经典权衡。雄性粪蝇与一只雌性交配的时间越久，它的精子成功使雌蝇受孕的几率就越高，但与其他雌性交配的机会就更小。

寻找一个新的交配对象对应着寻找一个新的食物源（之前例子中的蚜虫和灌木），相应的，边际价值理论亦可以预测到一只雄性粪蝇需要花多少时间交配来保证自己有更多的后代。在1976年，科学家也观测到了与边际价值理论预测相差不大的数据（预测为41分钟实际为36分钟）。

繁忙的蜜蜂会高效吗？

蜜蜂采集的花粉越多，它将花粉带回巢的时间就越长。每只蜜蜂都会面对这样的困境：什么时刻该停止采蜜返回蜂巢？

考虑一个极端情况，如果蜜蜂只采了一粒花粉就飞回蜂巢，那么它花费的能量一定会超过可以从这粒花粉获得的能量；另一种极端情况下，蜜蜂采的花粉太多，虽然花粉收集速度相对快，但承载这么多花粉回巢花费的能量占花粉能量的相当大一部分。在这两种极端中存在一个“黄金负载”，使得蜜蜂在消耗固定能量飞行时，携带的花粉能量为最大值。其中黄金负载到第二个极限之间收益减少是因为蜜蜂在花朵之间飞行的负载变沉了。

1985年，通过改变花朵和蜂巢之间的距离，科学家观察到蜜蜂承载花粉量符合边际价值理论的预测。简单来说，蜜蜂会选择更高效地收集花粉，对应于每克花粉需要的能量更低；而另一种基于每分钟收集更多花粉的模型却不大符合，说明蜜蜂们更喜欢能量高效化的采集模式。

大脑和边际价值理论

神经元几乎就只是进行信息处理，但维护神经元的成本很高、传输信息更甚，所以它们需要高效运作。

根据克劳德·香农的信息理论，比特作为信息单位，便于表达两个一样重要的选择（抛硬币这种）。同时，香农的理论定义了一个回报递减的普适定理，内容是处理信息的速度越快，处理每个比特信息需要消耗的能量越高，也就是说，信息处理速度越慢，成本越低；速度越快成本越高，不能既高速又廉价地处理信息。

能量效率随神经元放电率的变化，曲线峰值是预测的神经元平均放电率，和使神经元能量效率最大的理论一致。

这个回报递减定律和瓢虫问题类似，瓢虫获得食物的速度在递减，差别在于瓢虫追求的是平均获得食物的量最大，而神经元希望花费1焦耳能量处理的平均信息量最多。于是不难看出神经元问题也能通过边际价值理论解决。

于是，边际价值理论可以重新套用在消耗能量（对应时间）和处理信息（对应回报）上。测得的效率曲线展示出效用值在神经元放电率达到每秒2峰值时最大（单位是比特/焦耳），1996年科学家发现神经元平均放电率的观测值符合理论预测。

总之，边际价值理论描述了获得最大收益时需要付出多少，无论这个花费是寻找蚜虫的时间或是神经放电需要的能量，也无论收益的形式是每小时吃的蚜虫还是每焦耳处理的信息，它都能给出答案。

作者：James V. Stone

翻译：zhenni

审校：藏痴

原文链接：Knowing when to quit | plus.maths.org

福

利

shi

时

jian

间

今天我们将送出由电子工业出版社提供的《现代科研指北》。

这本书作者结合自己十余年来的科研经历和亲身体验，从不同的视角总结了科研人员所需的科研技能与思维方式，并对当前科研的现状与未来发展趋势进行了概述。“学而不思则罔，思而不学则殆”，积极学习与勤于思考是科研与治学的重要环节。不管你未来从事何种职业，书中提到的科研基本训练都能让你受益匪浅。

书中提及的查文献、做实验、处理数据、管理项目等研究技能，以及试错、质疑、提出假说的思考能力，对于解决现实科学问题很有帮助，也有助于解决其他行业的实际问题。同时，书中概述的研究领域所存在的趋势，例如可重复性危机、开放科学等议题也值得关注与思考。本书可供打算读研、正在读研的学生及初级科研人员参考阅读，构建或完善属于自己的科研方法论，在实践中获得真知。

互动问题：互动问题：你还知道符合什么数学/物理定律的动物行为？

请大家严格按照 互动：问题答案 的格式在评论区留言参与互动，格式不符合要求者无效。

截止到本周四中午12：00，参与互动的留言中点赞数排名第二、三、五的朋友将获得我们送出的图书一本（点赞数相同的留言记为并列，下一名次序加一，如并列第二之后的读者记为第三名，以此类推）。

为了保证更多的朋友能够参与获奖，过往四期内获过奖的朋友不能再获得奖品，名次会依次顺延

*本活动仅限于微信平台

翻译内容仅代表作者观点

不代表中科院物理所立场

编辑：藏痴