欢迎来到Python周刊第270期。让我们直奔主题。祝好。
嘿,Python粉,你想要表达你对Python的爱吗?那么,点击这里,获取你的T恤,骄傲地穿上它吧。
嵌入、编码、处理、预测:用于国家最先进的NLP模型的新深度学习公式
在过去的六个月中,自然语言处理迎来了一个强大的新神经网络方法。这个新的方法可以被总结为简单的四步骤公式嵌入、编码、处理、预测。这篇文章解释了这个新方法的组成部分,并展示了它们是如何用于两个最近的系统中的。
这篇文章的目的是展示如何在Python中使用一个干净的架构,从头开始构建一个web服务。这种分层设计的主要优点之一是可测性,因此,我将按照TDD方法来开发它。
对于基本的字符串处理而言,很难击败正则表达式。但对于许多问题,包括一些看似简单的问题,我们都可以使用有限状态转录机(FST)来获得更好的性能。FST是简单的状态机,正如其名,它具有有限数量的状态。但在我们讨论你可以用FST做到的事(从快速文本注释 —— 无正则表达式的灾难性的最坏行为 —— 到简单的自然语言生成,或者甚至是语音识别)之前,让我们看看状态机是什么,它们必须用正则表达式做什么。
使用Telegram和Python构建一个聊天机器人 (第一部分)
在这个教程中,我们将使用Python来构建一个简单的Telegram机器人。首先,我们的机器人将简单的回显任何我们发送给它的消息,接着,我们会对其进行扩展,添加一个数据库,并且持久化整个聊天会话中的信息。
在这个教程中,Zhuyi Xue带我们领略SciPy栈的一些功能。他还回答了关于人类基因组的一些有趣问题,包括:有多少基因组是不完整的?一个典型的基因有多长?
这篇文章试图解释python中所有关于文本和unicode处理的东东。
使用GRAKN.AI和Python来分析电影数据。
Podcast.init 第83集 - 和Travis Jungroth聊聊HouseCanary
住房是我们都会经历的事情,但许多人并不了解市场的复杂性。本周,Travis Jungroth谈论了HouseCanary如何使用数据来让房地产更透明的。
在这篇文章中,我们将看到如何为HAR(人类活动识别)部署卷积神经网络 (CNN),它将会自动学习复杂特性,从原始加速器信号到区分日常生活中的不同活动。
利用行为驱动开发(Behavior Driven Development,即BDD)来提高你的Django和Python栈吧。学习为你的应用编写BDD测试用例,并且避免用例错误。
你将学到使用Python和scikit-learn库创建一个成功的机器学习应用的必要步骤。作者Andreas Muller和Sarah更关注使用机器学习算法解决实际问题,而不是其背后的数学。熟悉NumPy和matplotlib库将帮助你从此书中获得更多的东西。
Superset是一个数据探索平台,旨在视觉、直观和交互。
MLAlgorithms
机器学习算法的最小化和干净实现的集合。
使用这个IFTTT的开源拷贝,控制你的数据,你的网络服务之间的桥梁。
增量拷贝Linux硬盘驱动器,或者拷贝到一个更小的驱动器。
Windows和Linux上的钩子和模拟键盘事件。
使用DeepMind的ByteNet,进行法语到英语机器翻译的一个tensorflow实现。
LightBulb是一个开源的python框架,用于审计web应用防火墙。
Place-Recognition-using-Autoencoders-and-NN
以下论文中讨论到的模型的Tensorflow实现: Low-effort place recognition with WiFi fingerprints using deep learning
从一个Python模块/函数生成一个CLI工具。
使用PCA(主成分)分析来识别画的像素,来组成一个光滑的调色板。
基于Raft算法,用于容错分布式系统的异步复制框架。
作为一个有追求的数据科学家,你或许听说过,你需要学习如何使用pandas, scikit-learn, 和其他Python库。但是你知道吗?你也能通过更好地使用Python语言本身来提升你的数据科学技能。在这个1小时的网络直播中,Michael Kennedy将会教你如何编写Pythonic代码,这是利用Python语言最佳特性的代码。这不仅会帮助你编写更有效更可读的代码,它还让你能够更快的挑选其他Python库!
让我们来聊聊Python中的鸭子类型!它是啥?为啥你应该关心它?
一起抓取一个数据集来预测奥斯卡得主 - Cambridge, MA
使用Jupyter notebook和scikit-learn,我将预测一个电影是否可能赢得奥斯卡金像奖或者卖座。我将展示创建一个有效数据集的大部分重要步骤,使用你在网上找到的信息:问你的数据可以回答的问题,编写一个网络爬虫,然后仅仅使用Python库和来自网络的数据来回答那些问题。为了描述这些步骤是如何相互协作的,我将从IMDB构建一个数据集,然后用它来预测什么成就了一个奥斯卡得奖电影。
给Python开发者的Plone, django CMS, Wagtail - London, United Kingdom
存在一些不错的Python网络内容管理系统 (CMS) - 一些非常有名,而一些是鲜为人知的宝石。我们将简单浏览每项技术,然后在最后进行问答环节。这个演讲将针对像我们这样的技术人员和Python开发者,因此,我们可以更好地理解这些工具可以如何帮助我们去帮助我们的用户的。