谢谢你留下时光匆匆
工作效率提升的经验谈

本文记录本人在工作中提升办公效率的一些经验,主要讨论与开发工作相关的效率提升的方法,当然,其中一些方法也可以被其它岗位工作者借鉴。


PyWebIO 文本输入输出模版

PyWebIO 是一个python框架,可以轻松为程序创建一个网页交互页面。我经常用python写一些输入文本返回文本结果的脚本,例如:输入一个长的json字符串,通过python函数返回一个格式化带缩进的json文本;又或是输入一个时间戳,返回一个中文年月日时间文本。这些脚本都可以通过PyWebIO建立起对应的网页交互界面。自己花了一点时间,面向此类文本输入输出任务,开发了一个简单的一个Pywebio页面模板。

模版界面
模版界面


Pandas 列名变量生成辅助工具

在用Python Pandas处理数据时候,我们经常会去做选取某一列的操作(e.g. df['some_col'])。这段代码需要敲击引号然后输入字符串,如果列名为中文,还需要切换输入法,非常影响开发的流畅性。

一个解决办法是,将 DataFrame 中的每一列的列名赋值成一个变量,在需要输入列名时,只需要输入对应的变量即可,借助于编辑器的代码补全功能,可以让选取列代码的开发更为便捷、流畅。


有趣实用的网站软件(三)

自己是一个很喜欢尝试新软件、探索新网站的人,这个系列文章,把自己觉得有趣的玩意,或者能提高效率的工具汇总起来,分享给大家。

本期关键词:生活,工具,娱乐


Pandas 选取行、选取列方式梳理

这篇笔记对Pandas DataFrame取数的各种写法与对应的各种返回结果做一个梳理。

如没有特殊声明,df变量的数据如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
>>> df

   col_1 col_2
a      0   foo
b      1   foo
c      2   bar
d      3   bar
e      4   foo
f      5   foo
g      6   bar
h      7   bar

在100个实践例子中学习Pandas

熟练掌握Pandas是一个比较漫长的过程,阅读入门教程或API文档只是上手的一部分。在实际操作中,数据各式各样,需要转换的格式也各不相同,在不熟练的情况下,一时间可能想不到用什么恰当的Pandas函数,导致写出的Pandas代码会比较复杂,既浪费时间也让代码难以阅读。一个比较好的学习方法是,能够结合实际任务中的用例,仔细阅读背后实现对应Pandas函数。这样在自身遇到类似的情况时,很容易联想到可以使用的Pandas命令。这篇文章收集了在实际工作中常见的Pandas数据清洗用例,每一个用例给出原来的表格式与数据、处理后的表格式与数据,以及相应的pandas代码,在一些函数后,我也附上一些注释,进行一些拓展讲解。比较推荐读者熟悉Pandas基础用法后再进行阅读,入门学习时,官方教学User Guide是一个不错的资源。


有趣实用的网站软件(二)

自己是一个很喜欢尝试新软件、探索新网站的人,这个系列文章,把自己觉得有趣的玩意,或者能提高效率的工具汇总起来,分享给大家。

本期关键词:开发,音乐,娱乐,消费,工具


算法类Java服务开发经验小结

本文总结了自己在算法工作中,Java服务开发的一些经验。算法工程师日常开发的内容主要是:从一个或多个源获取数据,在这些数据上做一些业务逻辑操作,返回一个列表给下游。例如:我们从推荐模型获取某用户的新闻推荐列表,从kv数据库获取某用户最近浏览过的新闻列表,将推荐列表中用户已经浏览过的新闻过滤掉,如果过滤后的列表有用户经常浏览类别的新闻,选2个放在返回结果的开头,剩下的按照新闻时间由旧到新排序。

这篇总结主要包括,常见需求的代码优化实践,简单的代码结构设计以及工程细节。


《读者》杂志epub电子书整理

自己中学时候经常看《读者》杂志。现在周围报刊亭很少了,加之阅读时间慢慢被刷手机占据,渐渐就没有了阅读《读者》的习惯。偶然间发现网站读者文摘杂志有《读者》的历史文章,便花了一点时间,将文章按每一期整理成epub电子书,便于有需要的人使用。


有趣实用的网站软件(一)

自己是一个很喜欢尝试新软件、探索新网站的人,这个系列文章,把自己觉得有趣的玩意,或者能提高效率的工具汇总起来,分享给大家。

本期关键词:音乐,设计,效率,娱乐,博客