博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据、机器学习与深度学习类命令行工具汇总
阅读量:5967 次
发布时间:2019-06-19

本文共 814 字,大约阅读时间需要 2 分钟。

《命令行上的数据科学(Data Science at the Command Line)》一书与GitHub皆为我们带来大量高水平的预处理与后处理类工具选项,大家亦可根据需要对其进行针对性调整。在今天的文章中,我将向各位强烈推荐自己最为喜爱的那些相关工具。

CSVKit绝对值得一试。其能够利用逗号分隔值实现您所需要的一切。大家可以通过cvs cut剪切列、使用cvsgrip进行列过滤、通过sql2csv将PostgreSQL中的数据提取至CSV、使用cols从列中剪切子集并通过in2cv将微软Excel转换为CSV。

快速工具推荐清单

  •  ().

  •  (edit, create, convert, flip, and alter images from the command-line).

  • .

  •  via NodeJS.

  • .

  • .

  • .

  • .

  •  for Testing with Scala/JVM.

  • .

  • .

  • .

  • .

  • .

  • .

  • .

  • .

  • .

  • (NPM.JS).

大家亦可以编写简短的Python脚本以通过命令行实现数据处理。

 
  1. from nltk.sentiment.vader 
  2. import SentimentIntensityAnalyzer 
  3. import sys 
  4. sid = SentimentIntensityAnalyzer() 
  5. ss = sid.polarity_scores(sys.argv[1]) 
  6. print('Compound {0} Negative {1} Neutral {2} Positive {3} '.format(ss['compound'], ss['neg'], ss['neu'], ss['pos'])) 

只需要五行Python脚本即可实现情绪分析。

大家甚至可以通过命令行实现TensorFlow调试(不过其目前尚处于beta测试阶段,所以可能会出现一些问题)。

作者:核子可乐译

来源:51CTO

转载地址:http://bfhax.baihongyu.com/

你可能感兴趣的文章
psql
查看>>
混沌数学之帐篷模型
查看>>
【BZOJ】3390: [Usaco2004 Dec]Bad Cowtractors牛的报复(kruskal)
查看>>
uint8_t / uint16_t / uint32_t /uint64_t 是什么数据类型(转)
查看>>
div+css 和 xhtml+css是一回事么?
查看>>
fiddler不能监听 localhost和 127.0.0.1的问题 .
查看>>
由system.currentTimeMillis() 获得当前的时间
查看>>
WF4 持久化 <第四篇>
查看>>
多选移动列表操作
查看>>
关于ActionContext.getContext()的使用方法心得
查看>>
iOS安全攻防(三):使用Reveal分析他人app
查看>>
WWDC2014 IOS8 APP Extensions
查看>>
Memcached原理深度分析详解
查看>>
quartz终止正在运行的任务
查看>>
ubuntu创建、删除文件及文件夹,强制清空回收站方法
查看>>
[原创] 浅谈ETL系统架构如何测试?
查看>>
Table '' is marked as crashed and should be repaired 解决方法
查看>>
数据库初识--从MySQL 出发
查看>>
《SQL Server企业级平台管理实践》读书笔记——几个系统库的备份与恢复
查看>>
SQL——索引
查看>>