SimpleDao
beeline连接Hive
2019-05-06, 访问数: 1239
连接beeline -n hive -p hive -u jdbc:hive2://127.0.0.1:10000 执行/usr/bin/beeline --color=true --showHeader=true --outputformat=tsv2 -n hive -p hive -u jdbc:hive2://hiveserver2.simpledao.com:10000 -e "set hive.merge.mapredfiles=true;set hive.merge.mapfiles=true;set hive.merge.smallfiles.avgsize=500000...
cdh-Cloudera Manager安装
2019-05-06, 访问数: 928
安装wget http://archive.cloudera.com/cm5/installer/latest/cloudera-manager-installer.binchmod u+x cloudera-manager-installer.binsudo ./cloudera-manager-installer.bin 服务命令service cloudera-scm-server start|stop|restartservice cloudera-scm-agent start|stop|restart
参考https://github.com/cloudera/cm_ext https://github.com/cloudera/cm_csds 生成parcel# 需要在目标文件夹内新建meta文件,并在meta中新建文件parcel.json,文件内容需要自己参考资料填写# 验证文件java -jar cm_ext/validator/target/validator.jar -p HELLO-1.0/meta/parcel.json# 验证目录java -jar cm_ext/validator/target/validator.jar -d HELLO-1.0# 打包parcel...
elasticsearch-sql设置返回的size
2019-05-06, 访问数: 977
elasticsearch-sql 默认返回的size是200,10。 可以在查询的时候显式设置size: SELECT SUM(succ) AS s FROM test1 GROUP BY terms(field='domain',size='1000',alias='domain'), terms(field='server',size='1000',alias='server')
elasticsearch常用操作
2019-05-06, 访问数: 1089
使用aggregations,排序必须要开启fielddataPUT my_index/_mapping/my_type{ "properties": { "my_field": { "type": "text", "fielddata": true } }} 安装,参数设置# 内核设置vm.swappiness=1vm.max_map_count=262144# 内存设置export ES_HEAP_SIZE=8g# 配置文件path.data: /home/stat/elasticsearch-6.1.1/datapath.logs: /...
git基本操作
2019-05-06, 访问数: 1089
clone远端项目git clone https://github.com/jquery/jquery.gitgit clone username@host:/path/to/repository 远程主机# 克隆版本库的时候,所使用的远程主机自动被Git命名为origingit remote -v# 将你的仓库连接到某个远程服务器git remote add origin <server> 提交,拉取# 注意,分支写法是<来源地>:<目的地># git fetch <远程主机名> <分支名>,使用"远程主机名/分支名"读取。比...
grafana安装使用
2019-05-06, 访问数: 923
安装wget https://s3-us-west-2.amazonaws.com/grafana-releases/release/grafana-4.3.2-1.x86_64.rpm sudo yum localinstall grafana-4.3.2-1.x86_64.rpm 配置文件/etc/grafana/grafana.ini 启动service grafana-server start 开机启动sudo systemctl enable grafana-server.service 设置template依赖选择参数$topic SHOW TAG VALUES WIT...
gunicorn配置
2019-05-06, 访问数: 1473
wsgi协议Python web开发中,服务端程序可分为2个部分: 服务器程序(用来接收、整理客户端发送的请求,容器),比如gunicorn,uwsgi应用程序(处理服务器程序传递过来的请求),比如Flask,Django等 服务器程序和应用程序要互相配合才能给用户提供服务,而不同应用程序(不同框架)会有不同的函数、功能。 此时,我们就需要一个标准,让服务器程序和应用程序都支持这个标准,这样,二者就能很好的配合了。 WSGI:wsgi是python web开发的标准,类似于协议。它是服务器程序和应用程序的一个约定,规定了各自使用的接口和功能,以便二和互相配合。 通俗地说,就是服务器程序...
Hbase操作
2019-05-06, 访问数: 947
建表create 'table1', { NAME => 'card', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROWCOL', REPLICATION_SCOPE => '1', COMPRESSION => 'SNAPPY', VERSIONS => '1', MIN_VERSIONS => '0', KEEP_DELETED_CELLS => 'false...
Hdfs设置账号权限
2019-05-06, 访问数: 861
设置目录的默认权限# 设置目录的默认权限,这样用户新创建的目录和子目录就会自动有权限hdfs dfs -setfacl -R -m default:group:group1:rwx /hive-dw/db1# 设置已有目录的权限hdfs dfs -setfacl -R -m group:group1:rwx /hive-dw/db1