From 6c7d889ac757aa561c48698f822829e2eca4bfef Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E2=80=98renyan=E2=80=99?= <1609532549@qq.com> Date: Sun, 31 Mar 2024 10:43:38 +0800 Subject: [PATCH] monthly update (2) --- content/post/2024-01-01-monthly.md | 84 +++++++++++++++++++++++ content/post/2024-04-01-monthly.md | 105 +++++++++++++++++++++++++++++ 2 files changed, 189 insertions(+) create mode 100644 content/post/2024-01-01-monthly.md create mode 100644 content/post/2024-04-01-monthly.md diff --git a/content/post/2024-01-01-monthly.md b/content/post/2024-01-01-monthly.md new file mode 100644 index 000000000..bf505dcce --- /dev/null +++ b/content/post/2024-01-01-monthly.md @@ -0,0 +1,84 @@ +--- +title: 统计月读(2023 年 12 月) +date: '2024-01-01' +categories: + - 推荐文章 + - 新闻动态 +slug: monthly +forum_id: +--- + +推荐语:想做甘特图,在线网页看上去效果很好很完善但是真的用起来结果一团糟,发现 mermaid.js 很适合用代码形式绘制流程图甘特图等图表,在 R 中使用 DiagrammeR 包即可直接调用。 + +推荐人:任焱 + +链接:https://www.rdocumentation.org/packages/DiagrammeR/versions/1.0.10/topics/mermaid + +--- + +推荐语:当样本缺乏代表性时,基于已知人口学特征进行事后分层(post-stratification)加权是常用技巧。但如果具体层次的样本量很少,该层点估计会面临较大误差。对此,可以利用多层模型的shrinkage特性,获得每层更稳健的点估计,然后再加权汇总。 + +推荐人:董书昊 + +链接(两篇文章): + +https://www.monicaalexander.com/posts/2019-08-07-mrp/ +https://marginaleffects.com/vignettes/mrp.html + +--- + +推荐语:R语言书籍的推荐,附有介绍和免费获取电子版的链接 + +推荐人:孔令仁 + +链接:https://oscarbaruffa.com/the-10-most-popular-r-books-of-2023/ + +--- + +推荐语:推荐R包MIDAS,可用于混频数据回归 + +推荐人:朱书慧 + +链接:Ghysels, E., Kvedaras, V., & Zemlys, V. (2016). Mixed Frequency Data Sampling Regression Models: The R Package midasr. Journal of Statistical Software, 72(4), 1–35. https://doi.org/10.18637/jss.v072.i04 + +--- + +推荐语:gspcr 用于广义线性模型的有监督 PCA,可以支持连续型、离散型和二分类型的结局变量。想做使用有监督 PCA 的逻辑回归时发现的,是最近才上传的一个包。 + +推荐人:宋文轩 + +链接:https://cran.r-project.org/web/packages/gspcr/index.html + +--- + +推荐语:LLM 如何切实帮助 R coder,chattr 只是在 R 内部提供了 ChatGPT 接口,gptstudio 更像一个内置工具。文章还从改善 http 请求效率(使用 SSEparser 包)的角度对上述 API 做了改进,值得一读。 + +推荐人:任焱 + +链接:https://samuelenrique.com/posts/2023-12-14-launching-sseparser/ + +--- + +推荐语:看不懂别人的代码一定要用用这个小工具,可以解释多种代码,会从代码结构,可能出现的bug,修改建议等等进行分析。 + +推荐人:任焱 + +链接:https://codepal.ai/code-explainer/r + +--- + +推荐语:因果推断与机器学习结合方法的python包,里面包含的方法很多,比如DML、DRL、正交随机树等,讲解也很细致,很实用~ + +推荐人:孔子怡 + +链接:https://econml.azurewebsites.net/spec/estimation/dml.html#what-is-it + +--- + +推荐语:一个经典结论的再现。由于上学通常会卡年龄(比如加拿大会卡在当年1月1日),在低年级时,体育队里往往大部分人会是同一年级中更早出生的那批人(发育了更长的时间)。例如在加拿大,体育队中年初出生的人较多,但也可能是因为更多的人本身就出生在年初。作者拿加拿大人口数据和NHL中加拿大球员的出生数据进行了研究,即对比两个分布是否相同。发现相比正常出生情况,NHL中的确有更多的加拿大人在年初出生。 + +推荐人:王祎帆 + +链接:https://jlaw.netlify.app/2023/12/04/are-birth-dates-still-destiny-for-canadian-nhl-players/ + +--- \ No newline at end of file diff --git a/content/post/2024-04-01-monthly.md b/content/post/2024-04-01-monthly.md new file mode 100644 index 000000000..6d37dcd51 --- /dev/null +++ b/content/post/2024-04-01-monthly.md @@ -0,0 +1,105 @@ +--- +title: 统计月读(2024 年 1-3 月) +date: '2024-04-01' +categories: + - 推荐文章 + - 新闻动态 +slug: monthly +forum_id: +--- + +推荐语:git 操作进阶读物。 + +推荐人:任焱 + +链接: https://masalmon.eu/2023/11/01/reading-notes-git-in-practice/ + +--- + +推荐语:文章很短,介绍了 base 包中容易被忽略的实用函数(新的 R 版本中,L %||% R 可以代替 if(is.null(L)) R else L 更加清晰明了。) + +推荐人:任焱 + +链接: https://ivelasq.rbind.io/blog/not-so-basic-base-r-functions/ + +--- + +推荐语:用“模拟方法”来评估一份定量研究设计的质量。书中思路框架的完成度相当高,也提供了对应的软件包。 + +推荐人:董书昊 + +链接: https://book.declaredesign.org/ + +--- + +推荐语:对conjoint experiments所产生数据的终极分析指南。 + +推荐人:董书昊 + +链接: https://www.andrewheiss.com/blog/2023/07/25/conjoint-bayesian-frequentist-guide/#sec-frequentist + +--- + +推荐语:marginaleffects是R中非常快捷的边际效应计算包。作者把说明文档直接整合成了一本书,并且放上了丰富的案例,例如因果推断中的g-computation,多层贝叶斯模型,以及MrP等。 + +推荐人:董书昊 + +链接: https://marginaleffects.com/vignettes/get_started.html + +--- + +推荐语:使用 ggplot2 为实验设计研究绘制各种常见的图形,为因子设计和响应面分析绘制包括 lambda 图、箱线图、交互效应图、等高图等。 + +推荐人:宋文轩 + +链接: https://cran.r-project.org/web/packages/ggDoE/ + +--- + +推荐语:清华工程物理系的续本达老师写的一篇热情洋溢的教学总结,《实验物理的大数据方法》是清华物理系的暑期小学期课程,这门课是物理系从理论到代码练习的过程,对统计系的教学应该也有些启发。 + +推荐人: 陈星宇 + +链接: https://hep.tsinghua.edu.cn/~orv/teaching/summary.html(《实验物理的大数据方法》课程总结) + +--- + +推荐语:Obeservational Studies 2022年出版了一期特别刊,有4位因果推断大牛(按字母排序)的访谈: + +- [James Heckman](https://muse.jhu.edu/pub/56/article/867086) + +- [Judea Pearl](https://muse.jhu.edu/pub/56/article/867087) + +- [Jamie Robins](https://muse.jhu.edu/pub/56/article/867088) + +- [Don Rubin](https://muse.jhu.edu/pub/56/article/867089) + +推荐人: 陈星宇 + +链接: https://muse.jhu.edu/journal/793(Observational Studies) + +--- + +推荐语:大模型的发展使得网上查阅到的资料并不一定可信了,它们有可能是 AI 生成的网页,一些人使用自动技术写不正确的代码指导获取自己的获利目标,文章指出这个问题,并指出了几种分辨劣质自动网站的方法,如同一天发布过多文章,查阅资料时要注意辨别真伪。 + +推荐人:任焱 + +链接: https://www.rostrum.blog/posts/2024-03-15-ai-garbage/ + +--- + +推荐语:沃顿商学院教授认为加沙政府公布的数据看上去是假的,加州理工的Pachter教授则认为这源于一种不恰当的数据处理方法,文章评论也有很多有价值的讨论。 + +推荐人:于淼 + +链接: https://liorpachter.wordpress.com/2024/03/08/a-note-on-how-the-gaza-ministry-of-health-fakes-casualty-numbers/ + +--- + +推荐语:推荐一本 R 进阶书,原本以为自己会 R,没想到会的只是一种表象,模仿别人准备好的教程完成建模和分析是简单的,了解原理又是另外一回事。 + +推荐人:任焱 + +链接: https://adv-r.hadley.nz/oo.html + +--- \ No newline at end of file