【阅】本周阅读摘选2023-09-04 → 2023-09-10

Posted by Cao Zihang on September 11, 2023 Word Count:
本周阅读摘选
2023-09-04 → 2023-09-10
目录

学术相关

Reducing single-use cutlery with green nudges: Evidence from China’s food-delivery industry1

The cost of anti-Asian racism during the COVID-19 pandemic2

Losing our way? A critical examination of path analysis in accounting research3

商科研究对路径分析的误用。

【 ChatGPT作者LilianWeng博客总结】智能体=LLM(大语言模型)+记忆+规划技巧+工具使用

ChatDev:大模型AI Agent驱动的虚拟软件公司,荣登GitHub Trending榜首!

业界动态

2023阿里妈妈m峰会:智链万象 简单经营 丨百度营销:轻舸

近期阿里和百度先后推出了它们的数智化营销(或者说是推广与销售)方案,试图将以大语言模型为代表的技术方案与实际商业经营相结合。

2023阿里妈妈m峰会的主题颇有意思,前国金证券传媒互联网首席、现优质自媒体互联网怪盗团创作者指出:“简单经营”这四个字很好地命中了当前商家痛点。目前,随着零售电商消费场景不断丰富、消费需求复杂化、获客方式渠道多元化深度化套路化,零售电商运营技术壁垒与资本需求壁垒持续攀升,大量电商商家面临着经营难题。阿里妈妈给出的方案就是做减法:基于数智化的简化。具体上,阿里妈妈推出了“万相台无界版”,以及“阿里妈妈百灵”——前者整合淘内渠道资源,后者整合淘内外品牌资源。

此外,互联网怪盗团还指出本次m峰会阿里妈妈提出了“店铺、直播、内容”三中心增量场的概念也是重要措施,试图打破大众对“传统电商没有增量”的认知。淘宝天猫的运营以店铺为“流量+增量”的支点,强化品牌经营;通过新类型直播加速引爆,阿里妈妈数据表明,直播商家店均生意增量比全站平均水平高出7~11倍(这一数据没有排除样本选择偏差)。在增长点上,阿里妈妈主要提出了更加智能、简单的直播推广和直播文案、素材、剪辑的内容生成。

从发布的AI技术产品上概括,大致可以说阿里妈妈这次主要提供了AI三大普惠力:创造力(内容生成)、决策力(数据分析 & 科学经营)、投放力(精准投放)。


无独有偶,几乎同一时间百度营销宣布接入文心一言,推出新一代营销平台轻舸,通过人机交互实现大语言模型内容生成。百度营销宣布轻舸能够将搜索广告方案的创作、编辑时长直接从小时级缩短到分钟级;在成本下降10%的情况下,业务转化量提升23%,整体ROI提升22.7%。

此外,百度营销此前也发布了擎舵AIGC创意工具多维度流量洞察等配套工具,目的就是让用户“放开说、简单用、都搞定”。

将阿里妈妈与百度营销的数智化营销方案进行对比,不难发现阿里妈妈的技术体系紧密围绕着“人货场”的零售核心,与既往经营方向承前启后,立足自身优势,试图通过AI技术为商家降本增效;而百度则明显表现出自身的工程师文化以及成为人工智能公司的企业战略定位,其设计思路主要围绕自身的大模型体系,试图为其拓展应用范畴,发挥技术B2B长处。此外,一件有趣的事情是今年5月百度万象大会宣布推出“百度优选”电商平台,试图将自身搜索优势流量变现。目前,整体来看阿里妈妈技术方案在商业逻辑上更加完善自洽,且在零售领域对AI技术进行专业化系统集成更具有经验和实操优势,而百度在零售电商上则是刚刚起步,再加上百度在以往经营过程中,其商业模式变现环节通常过于传统,容易造成消费者不满,这一特征在垄断程度较低的同质化行业或产生较大制约,因此这次进入零售电商的尝试我认为还是有待观察的。

当然,毫无疑问AI+零售的新技术背景进一步颠覆了传统Marketing框架体系,在这一领域充斥着新发现的机遇。

技术技巧

R语言贝叶斯METROPOLIS-HASTINGS GIBBS 吉布斯采样器估计变点指数分布分析泊松过程车站等待时间

万字长文,梳理清楚Python多线程与多进程!

进程(Process)是资源分配的最小单元,线程(Thread)是CPU调度的最小单元。

进程与资源分配有关,所有与进程相关的资源都被记录在进程控制块PCB中,表示进程拥有资源或正在使用它们,进程拥有一个完整的虚拟地址空间。当进程发生调度时,不同进程拥有不同虚拟地址空间,而统一进程内不同线程共享同一地址空间。

线程与资源分配无关,它隶属于某一进程,并与进程内其他线程共享进程资源。线程只由相关堆栈(系统栈/用户栈)寄存器和线程控制表TCB组成,寄存器可以存储线程内的局部变量,但不能存储其他线程的相关变量。

维度 多进程 多线程 比较
数据共享&同步 数据共享复杂
数据同步简单
数据共享简单
数据同步复杂
各有优劣
内存&CPU 占用内存多
切换复杂
CPU利用率低
占用内存少
切换简单
CPU利用率高
线程占优
创建&销毁&切换 复杂且慢 简单快捷 线程占优
编程&调试 简单 复杂 进程占优
可靠性 进程间独立 一个线程挂掉则整个进程挂掉 进程占优
分布式 适合多核
易扩展到多机
适合多核 进程占优

Python全局解释器锁GIL

Python解析器CPython的一个概念,Python代码的执行由CPython控制,GIL保证同一时刻只有一个线程在运行。这样的优势是单线程更快,不需要考虑线程安全问题。

图片

全局解释器锁的存在使得多线程比较容易实现,但损失了多线程的并行计算能力。实际运行顺序:

  • 设置GIL
  • 切换一个线程运行
  • 运行至制定数量的字节码指令或线程主动让出控制
  • 将该线程设置为睡眠状态
  • 解锁GIL
  • 重复上述步骤

Python的多线程对多核CPU容易出现线程颠簸(Thrashing)问题,导致效率低下。应对措施主要包括:使用多进程替换多线程(消耗更多资源)、制定CPU运行线程(affinity模块)、使用Jpthon等无GIL解释器、使用协程(微线程,常与多进程配合使用)、使用C/C++编写扩展。

Python threading库主要用于多线程开发,但由于GIL限制,Python的多线程并非真正的多线程,常用的方法是使用多进程。

Python多进程库multiprocessing

该库具有多线程库threading的完整接口,但同时为每个进程赋予独立的GIL。multiprocessing还支持子进程、通信和共享数据、执行各类同步,提供了Process、Queue、Pipe、Lock等组件。

G6 5.0-Beta 闪亮登场

阿里前端AntV关系型数据可视化(图模型、树模型等)更新了。

ezgif.com-video-to-gif (1)

Python库:Latexify自动转化LaTeX代码

它可以将Python函数、Numpy表达式直接转换为LaTeX代码嵌入到Jupyter等页面中,增强展示效果,简化代码。

Google:latexify_py

它主要通过函数/表达式装饰器实现,支持自定义变量LaTeX转化。

example

  1. He, G., Pan, Y., Park, A., Sawada, Y., & Tan, E. S. (2023). Reducing single-use cutlery with green nudges: Evidence from China’s food-delivery industry. Science, 381(6662), eadd9884. https://doi.org/10.1126/science.add9884 

  2. Huang, J. T., Krupenkin, M., Rothschild, D., & Lee Cunningham, J. (2023). The cost of anti-Asian racism during the COVID-19 pandemic. Nature Human Behaviour, 7(5), 682–695. https://doi.org/10.1038/s41562-022-01493-6 

  3. Lennox, C., & Payne-Mann, C. (2023). Losing our way? A critical examination of path analysis in accounting research. SSRN Electronic Journal. https://doi.org/10.2139/ssrn.4476786