Cao Zihang - Blog

「抵近知识无人区」

【阅】本周阅读摘选2023-02-20 → 2023-02-26

本周阅读摘选 2023-02-20 → 2023-02-26 目录 学术相关 通过AI聊天机器人测量个性,靠谱吗? 在灾难期间使用社交媒体进行子事件检测 毛咕噜TOP5: AI自动智能化给普通劳动者的灾难性影响已经发生! 引言 理论框架 实证分析 一般均衡效应与量化分析 做“好”研究必读文献清单 ...

【阅】本周阅读摘选2023-02-13 → 2023-02-19

本周阅读摘选 2023-02-13 → 2023-02-19 目录 学术相关 10个用于可解释AI的Python库 Attention is all your need 机器学习技术:多任务学习综述! 多任务学习multi-task learning (MTL) MTL网络结构 MTL损失函数 多任务学习经典品读:MMoE模型篇 ...

【阅】本周阅读摘选2023-02-06 → 2023-02-12

本周阅读摘选 2023-02-06 → 2023-02-12 目录 学术相关 AI绘画爆火背后:扩散模型原理及实现 引入因果线索的对话情绪识别模型CauAIN 因果线索获取 因果意识交互 实验结果 消融实验 从玄学走向科学:AB测试驱动的科学增长 广告场景下双边市场的实验设计 基于话题标签(#)的社交媒体...

【阅】本周阅读摘选2023-01-30 → 2023-02-05

本周阅读摘选 2023-01-30 → 2023-02-05 目录 学术相关 Coggle数据科学推荐系统系列1:深入理解YouTube推荐系统算法 系统框架 召回网络 排序网络 机器学习百道面经 高效整数规划求解,快手提出多元因果森林模型,智能营销效果显著 风笑天:读懂一篇文献需要回答的20个问题 Transformer ...

【阅】本周阅读摘选2023-01-23 → 2023-01-29

本周阅读摘选 2023-01-23 → 2023-01-29 月初得了新冠,症状比较重,一个月了还没有痊愈,耽误了不少时间 前段时间买了一年的.asia域名,利用vercel部署了RSSHub并在win端利用Fluent Reader订阅了一些有趣的论坛、公众号和博客。摆脱了推荐算法的感觉让我很快乐,对接收信息有很好的掌控感\^o^ 我打算之后每周发布一条阅读摘选,加深对读过的优质信息的印象,以供查阅 目录 学术相关 “研究困惑”的困惑——社会学研究中的理...

【数据集】快手推荐系统数据集KuaiRand

偶然看到一个数据集,觉得很有意思 它包含(深度)用户的12个反馈信号和 不知道以后会不会用到,先记录一下 【我们如何与计算机研究人员区分开,或者说我们如何让算法成为消费者行为分析的工具而不是替代者呢?】 【如何区分我倒有一个想法:形成比较优势——多数算法的突破是建立在资源质变的基础上的,而这对多数中小企业而言是不现实的;更好的应对环境突变和分布偏移问题也是一个目前比较好的点】 KuaiRand:快手提供的在标准推荐下插入了一些随机暴露项目的用户行为数据集 论文:KuaiRand: An ...

【Deep Learning】第17章 蒙特卡罗方法

第17章 蒙特卡罗方法 随机算法可大致分为Las Vegas算法和蒙特卡罗算法 Las Vegas算法精确地返回一个正确答案或失败 占用随机量的计算资源 蒙特卡罗算法消耗固定的计算量返回具有随机大小的错误 增大计算量消耗能减少随机错误 蒙特卡罗采样基础 当我们需要以较小的代价近似许多项的和或某个积分时,采样是一种灵活的选择 当无法精确计算和或积分(如具有指数数量项的和),常用蒙特卡罗采样近似 蒙特卡罗采样把和或积分视作某...

【Deep Learning】第12章 应用

第12章 应用 大规模深度学习 计算机视觉 预处理 图像应该被标准化 许多CV架构需要标准尺寸的图像,必须剪裁或缩放图像以适应该尺寸;一些卷积模型接受可变大小输入 对比度归一化 在许多任务中,对比度是能够安全移除的最为明显的变化源之一 对比度:图像中亮像素和暗像素之间差异的大小 图像三维张量对比度:$\sqrt{\frac{1}{3rc}\sum\limits_{i=1}^{r}\sum\limits_{j=1}^{c}\sum\limits_{k=1}^{3}(\mathsf{X}{i,j,k}-\bar...

【Deep Learning】第11章 实践方法论

第11章 实践方法论 实践设计流程: 确定目标(依据问题决策) 误差度量方法 目标值 建立端到端的工作流程 估计合适的性能度量 搭建系统 确定性能瓶颈 检查未及预期环节 过拟合&欠拟合 数据缺陷 软件缺陷 反复改进 增...

【Deep Learning】第10章 序列建模:循环和递归网络

第10章 序列建模:循环和递归网络 循环神经网络RNN是一类用于处理序列数据的神经网络 RNN可以扩展到很长的序列,大多数RNN能处理可变长度序列 参数共享使模型能够扩展到不同形式的样本(不同长度的样本)并进行泛化 当信息的特定部分在序列内多个位置出现时,参数共享尤为重要 时间序列上的卷积:时延神经网络 卷积允许共享网络跨时间共享参数,但是浅层的 参数共享体现在每个时间步中使用相同的卷积核 循环神经网络参数共享通过输出的每一项是前一项的函数 循环网络通常在序列的小批量上操作,并且小批量的每一项具有不同序...