传媒教育网
标题: 运用“控制变量法”,使论证更科学有效 [打印本页]
作者: 刘海明 时间: 2025-10-15 15:08
标题: 运用“控制变量法”,使论证更科学有效
[url=]王小杨评论笔记 [/url]
2025年10月15日
在写评论过程中,为了说服潜在的读者,你必须讲道理,也就是要建立有效论证。从科学方法论的角度看,最有效的证明手段之一就是控制变量法。
你为了证明A与B的相关性及因果性,就需要论证:
一、如果A上升B也上升,A下降B也下降,A与B之间就有了相关性,而且是正相关(positively correlated),正比例是一种正相关,反之则不然;
二、如果有A就有B,没有A就没有B,那么A与B就有了因果性。相关性不等于因果性,也有可能是一个原因导致的两个相关结果,即便有因果性也有孰因孰果的问题。
关于如何使用控制变量法来论证,这里举一些例子:
例子一:AI会不会导致工作大量消失?
这几年来,人工智能(AI)取得了显著的进展,从ChatGPT开始,中外很多公司掀起了投资AI的热潮,个人与企业也积极拥抱AI,作为生产力工具,以提高工作效率。因此不少人会有忧虑:AI会不会导致工作大量消失,会不会导致自己失业或大学毕业后找不到工作?我们不能凭感觉或身边的统计学来回答这个问题,因为这样的答案很可能是有偏的,不能反映整体情况。
最近,有两位哈佛大学经济学博士生,用统计学的方法来研究这个问题,在我看来,给出了一个较为可信的回答。这篇论文的题目为:《Generative AI as Seniority-Biased Technological Change:Evidence from US Resume and Job Posting Data》,感兴趣的同学不妨找来一阅。
首先,他们找来了一家公司从LinkedIn(相当于中国的Boss直聘)搜集的数据,包括28.5万家招聘的公司,覆盖了6200万求职者的简历,以及超过1.5亿次的招聘记录。
统计的结果显示,从2015年到2022年,无论初级职位(Junior-level)还是高级职位(Senior-level)的就业人数都是不断增长的;但从2022年下半年开始,高级职位的就业人数还继续保持增长,初级职位的增长则开始踟蹰不前,到2023年年中,初级职业的就业人数开始下降了,两条线的趋势分道扬镳,这就有意思了。分歧的时点与ChatGPT推出时间高度契合,这是耦合(凑巧),还是真的有相关性或因果性?
他们就使用了控制变量法,把招聘公司分为使用AI的公司与未使用或至少未表明使用AI的公司。他们规定,如果一家公司在招聘的职位描述中使用了LLM(大语言模型)、Prompt Engineer、GenAI等和生成式AI相关的字眼,那就推定这家公司在使用AI作为生产力工具。其余的公司则作为对照组。
说明一下,这里他们所选择的变量就是公司使用AI与否,具体的取值是两个离散的点:有与无,可以分别用数字1与0来表示。这一变量的性质是离散的、非连续的。变量当然可以是连续的,譬如y=2x,变量x取值范围是全体实数,因而连续变量,这是初中数学的知识范畴。
他们发现,使用AI的公司自2023年第一季度开始出现了大规模增长,而且,这些公司的初级职位就业人数,相对于对照组,出现了断崖式下降;与此同时,高级职位在这两组公司中则没有这样的差异,只是使用AI的公司高级职业增长更为强劲一些。
由此,结论就是呼之欲出,越来越多的公司在使用AI作为生产力公司,这些使用AI公司正在对年轻人关上大门,也就是说AI正在取代初级职位。这是一个很有说服力的证明。
例子二:预制菜比新鲜食材更健康、更营养、更安全?
前段时间的预制菜大讨论。有一些科普党试图向大众证明,预制菜比新鲜食材更健康、更营养、更安全,他们认为速冻的西兰花比新鲜西兰花更好,可惜他们的论证是值得商榷的,直白地说是不成立的。
这里引用食品安全专家朱毅的分析:在速冻与新鲜西兰花的优劣讨论中,一个普遍存在的认知误区,是不知不觉被拉到了非对称预设的对比陷阱里。论证速冻西兰花更优,先行设定了双重标准,将冷冻品置于最佳状态采摘、采后即时规范预处理、急冻锁鲜、营养无损耗的理想状态。
同时把市售新鲜西兰花预设为农残超标、微生物污染、储运不当、鲜度严重流失的劣质样本。这种对比违背了科学分析中变量控制的核心原则,相当于用标准化处理的合格产品对标流程失控的问题产品,其结论不具备说服力。
我在此基础上补充一点。这种有问题的对比,问题就在于:其不是在保持所有其他条件的前提下只让一个变量变(食材是新鲜还是速冻),因而可以看出新鲜食材与冻品哪个更好,而是让好几个变量同时变——冷冻品最佳状态采摘、菜后即时规范预处理Vs新鲜西兰花放置了一段时间,冷冻品无农残无污染Vs新鲜西兰花有农残、鲜度严重流失,等等,这摆明了是欺负人,比田忌赛马还过分。
摘引我之前一篇文章的分析:餐厅难道不可以挑选合格供应商,定期检测农残,每天供应没有农残的新鲜蔬菜吗?如果新鲜的蔬菜是有农残的,那么用有农残的新鲜蔬菜加工出来的预制菜就没有农残了吗?可能不仅有农残,还加了一大堆防腐剂保水剂增加了额外的健康风险。长时间冷冻的食材如果被李斯特菌之类的病原体污染了,那健康风险大了去了,这些都是新鲜食材所没有的风险。所以,在所有条件相同之下,同一食材,新鲜食材原则上当然比预制菜更健康、更安全,这是一个基本的逻辑问题。
反过来,你怎么保证冷冻一直维持在负18摄氏度以下呢?现在因为有峰谷电价,大致深夜到清晨的一段时间因为用电量较少、电价低,其余用电高峰、电价就高,根据行内人士披露,不少冷库在低谷电价低时开着,在高峰电价时则关上反正即便温度上升一时半会也化不了。还有你怎么避免商家反复解冻又冻上?
所以,现实中的冷冻与科普党人理想状态下、不计成本的冷冻根本就不是一回事。
更进一步,控制变量法可以数理化。
有些同学学过微积分。在多变量微积分中,有多个自变量,怎么求偏导数?就是把其他所有变量看成常数,然后只让一个变量变,就像一个普通的单变量微积分求导书一样,求出来的关于这个变量的偏导数就反映了这个变量的变化率或变化趋势,“所有其他条件相同”变成数学语言就是“把其他所有变量看成常数”。
具体到西兰花,我们只让一个变量变,就是新鲜还是冻品,其他条件则必须相同:有农残的新鲜西兰花Vs有农残的冻品,无农残的新鲜西兰花Vs无农残的冻品......这才是公平、客观、科学的对比,而非在分析上玩弄作弊手法——这是一种智识与道德上的不诚实。
以下红网青椒训练营互动精选
案例1:疯狂的网红直播在制造“公地悲剧”
选题角度:
1. 涉事网红(如“浪浪”)被惩处是咎由自取,其从私域走向公域,反映出内容创作无下限的趋势在增强,此前老八、独臂胜哥等也因违规被平台封杀。
2. 猎奇围观者需反思,其对猎奇的兴趣与这类内容的不断出现相关,不能仅为生活“添味”而忽视猎奇内容的负面影响。
3. 社交媒体平台虽称“技术中立”,却通过造新词热梗、打造“稀缺感”吸引流量,失序猎奇流量害人害己,头条和UC已被查,其他平台应改进。
导师建议:无下限“创新”可以做大流量、增加活跃度,对平台也有好处,唯一不好的是破坏社会道德、价值观,也是一种”公地悲剧” 。
案例2:代写包发,谁为毕业与职称开绿灯
选题角度:
1.从高校视角切入,指出当前高校在毕业论文管理中的两大问题——监管上“重终稿查重、轻过程管控”存在漏洞,教育上“重学术禁令、轻写作指导”存在缺位。
2. 以新闻事实为起点,拆解问题后结合高校现有教学框架,提出拆分查重节点、细化导师责任等务实建议,内容均基于报道推导,不脱离实际 。
导师建议:
有需求就有供给。重点可放在需求方是哪些:需要评职称的教师、需要论文才能毕业的本硕博研究生——这是催生灰黑产业链的源头,代写→发表,发表环节还有水刊、假刊。
来源:王小杨评论笔记
编辑:梅镕缨
| 欢迎光临 传媒教育网 (http://47.106.15.148/) |
Powered by Discuz! X3.2 |