Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

monthly update (2023-11-12,2024-01-03) #1125

Open
wants to merge 1 commit into
base: master
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
84 changes: 84 additions & 0 deletions content/post/2024-01-01-monthly.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,84 @@
---
title: 统计月读(2023 年 12 月)
date: '2024-01-01'
categories:
- 推荐文章
- 新闻动态
slug: monthly
forum_id:
---

推荐语:想做甘特图,在线网页看上去效果很好很完善但是真的用起来结果一团糟,发现 mermaid.js 很适合用代码形式绘制流程图甘特图等图表,在 R 中使用 DiagrammeR 包即可直接调用。

推荐人:任焱

链接:https://www.rdocumentation.org/packages/DiagrammeR/versions/1.0.10/topics/mermaid

---

推荐语:当样本缺乏代表性时,基于已知人口学特征进行事后分层(post-stratification)加权是常用技巧。但如果具体层次的样本量很少,该层点估计会面临较大误差。对此,可以利用多层模型的shrinkage特性,获得每层更稳健的点估计,然后再加权汇总。

推荐人:董书昊

链接(两篇文章):

https://www.monicaalexander.com/posts/2019-08-07-mrp/
https://marginaleffects.com/vignettes/mrp.html

---

推荐语:R语言书籍的推荐,附有介绍和免费获取电子版的链接

推荐人:孔令仁

链接:https://oscarbaruffa.com/the-10-most-popular-r-books-of-2023/

---

推荐语:推荐R包MIDAS,可用于混频数据回归

推荐人:朱书慧

链接:Ghysels, E., Kvedaras, V., & Zemlys, V. (2016). Mixed Frequency Data Sampling Regression Models: The R Package midasr. Journal of Statistical Software, 72(4), 1–35. https://doi.org/10.18637/jss.v072.i04

---

推荐语:gspcr 用于广义线性模型的有监督 PCA,可以支持连续型、离散型和二分类型的结局变量。想做使用有监督 PCA 的逻辑回归时发现的,是最近才上传的一个包。

推荐人:宋文轩

链接:https://cran.r-project.org/web/packages/gspcr/index.html

---

推荐语:LLM 如何切实帮助 R coder,chattr 只是在 R 内部提供了 ChatGPT 接口,gptstudio 更像一个内置工具。文章还从改善 http 请求效率(使用 SSEparser 包)的角度对上述 API 做了改进,值得一读。

推荐人:任焱

链接:https://samuelenrique.com/posts/2023-12-14-launching-sseparser/

---

推荐语:看不懂别人的代码一定要用用这个小工具,可以解释多种代码,会从代码结构,可能出现的bug,修改建议等等进行分析。

推荐人:任焱

链接:https://codepal.ai/code-explainer/r

---

推荐语:因果推断与机器学习结合方法的python包,里面包含的方法很多,比如DML、DRL、正交随机树等,讲解也很细致,很实用~

推荐人:孔子怡

链接:https://econml.azurewebsites.net/spec/estimation/dml.html#what-is-it

---

推荐语:一个经典结论的再现。由于上学通常会卡年龄(比如加拿大会卡在当年1月1日),在低年级时,体育队里往往大部分人会是同一年级中更早出生的那批人(发育了更长的时间)。例如在加拿大,体育队中年初出生的人较多,但也可能是因为更多的人本身就出生在年初。作者拿加拿大人口数据和NHL中加拿大球员的出生数据进行了研究,即对比两个分布是否相同。发现相比正常出生情况,NHL中的确有更多的加拿大人在年初出生。

推荐人:王祎帆

链接:https://jlaw.netlify.app/2023/12/04/are-birth-dates-still-destiny-for-canadian-nhl-players/

---
105 changes: 105 additions & 0 deletions content/post/2024-04-01-monthly.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,105 @@
---
title: 统计月读(2024 年 1-3 月)
date: '2024-04-01'
categories:
- 推荐文章
- 新闻动态
slug: monthly
forum_id:
---

推荐语:git 操作进阶读物。

推荐人:任焱

链接: https://masalmon.eu/2023/11/01/reading-notes-git-in-practice/

---

推荐语:文章很短,介绍了 base 包中容易被忽略的实用函数(新的 R 版本中,L %||% R 可以代替 if(is.null(L)) R else L 更加清晰明了。)

推荐人:任焱

链接: https://ivelasq.rbind.io/blog/not-so-basic-base-r-functions/

---

推荐语:用“模拟方法”来评估一份定量研究设计的质量。书中思路框架的完成度相当高,也提供了对应的软件包。

推荐人:董书昊

链接: https://book.declaredesign.org/

---

推荐语:对conjoint experiments所产生数据的终极分析指南。

推荐人:董书昊

链接: https://www.andrewheiss.com/blog/2023/07/25/conjoint-bayesian-frequentist-guide/#sec-frequentist

---

推荐语:marginaleffects是R中非常快捷的边际效应计算包。作者把说明文档直接整合成了一本书,并且放上了丰富的案例,例如因果推断中的g-computation,多层贝叶斯模型,以及MrP等。

推荐人:董书昊

链接: https://marginaleffects.com/vignettes/get_started.html

---

推荐语:使用 ggplot2 为实验设计研究绘制各种常见的图形,为因子设计和响应面分析绘制包括 lambda 图、箱线图、交互效应图、等高图等。

推荐人:宋文轩

链接: https://cran.r-project.org/web/packages/ggDoE/

---

推荐语:清华工程物理系的续本达老师写的一篇热情洋溢的教学总结,《实验物理的大数据方法》是清华物理系的暑期小学期课程,这门课是物理系从理论到代码练习的过程,对统计系的教学应该也有些启发。

推荐人: 陈星宇

链接: https://hep.tsinghua.edu.cn/~orv/teaching/summary.html(《实验物理的大数据方法》课程总结)

---

推荐语:Obeservational Studies 2022年出版了一期特别刊,有4位因果推断大牛(按字母排序)的访谈:

- [James Heckman](https://muse.jhu.edu/pub/56/article/867086)

- [Judea Pearl](https://muse.jhu.edu/pub/56/article/867087)

- [Jamie Robins](https://muse.jhu.edu/pub/56/article/867088)

- [Don Rubin](https://muse.jhu.edu/pub/56/article/867089)

推荐人: 陈星宇

链接: https://muse.jhu.edu/journal/793(Observational Studies)

---

推荐语:大模型的发展使得网上查阅到的资料并不一定可信了,它们有可能是 AI 生成的网页,一些人使用自动技术写不正确的代码指导获取自己的获利目标,文章指出这个问题,并指出了几种分辨劣质自动网站的方法,如同一天发布过多文章,查阅资料时要注意辨别真伪。

推荐人:任焱

链接: https://www.rostrum.blog/posts/2024-03-15-ai-garbage/

---

推荐语:沃顿商学院教授认为加沙政府公布的数据看上去是假的,加州理工的Pachter教授则认为这源于一种不恰当的数据处理方法,文章评论也有很多有价值的讨论。

推荐人:于淼

链接: https://liorpachter.wordpress.com/2024/03/08/a-note-on-how-the-gaza-ministry-of-health-fakes-casualty-numbers/

---

推荐语:推荐一本 R 进阶书,原本以为自己会 R,没想到会的只是一种表象,模仿别人准备好的教程完成建模和分析是简单的,了解原理又是另外一回事。

推荐人:任焱

链接: https://adv-r.hadley.nz/oo.html

---