zhangguanzhang's Blog

zhangguanzhang's Blog

站在巨人的肩膀上

对于初入k8s和kubeadm的一些建议
主要还是简单说下kubeadm 说说一些现象    无论docker还是K8s群看见过太多人盲目了有些是赶鸭子上来的,有的是跟风盲目进来乱学的.其中较多的分类为: 不学docker直接学k8s的跟风狗 没有熟悉Linux操作和一些基础知识的开发 Docker学得不怎么样就迫不及待来学的跟风狗 入门最具有争议的问题就是如何开始,k8s各个组件对于小白来说搭建方式和配置文件对于入门的人来说太庞大了,对于环境来学习一般分为下面两种 按照别人博客或者文章去手动搭建一个环境后学习 找个简易部署的方案来部署环境来学(kubeadm或者ansible...
一次docker镜像的解耦--onlyoffice
年初的时候就考虑过搭建个在线编辑excel的,之前试过很多owncloud,seafile,nextcloud,kodexplorer基本都是纯网盘或者不免费 这几天又有需求多人同时在线编辑office文件,同事找了个onlyoffice的用docker跑起来了. dockerhub上看了下镜像挺大的而且没有跳转到github上Dockerfile的超链接 稍微用docker history看了下发现里面一堆各种数据库都放同一个镜像里,根本没有解耦 于是便有了解耦这个镜像的冲动 先找官方的例子跑跑看 地址:https://api.onlyoffice.com/editors/demopr...
记录一次十字符病毒清理过程
周五网络组同事告知几个租户的session过大,建议我把租户这几台机器关机了我进去后把网卡down了后开始看稍微看了下是好几个十个字符的进程一直杀不完,叫存储同事把快照挂载了准备周一恢复 结果今天挂载上去后开机发现还是有,好吧,手动查杀结合猜想和状态输出想了下逻辑是如下思路 crontab加计划(/var/spool/cron/用户名文件,/etc/crontab里,/etc/cron.hourly/x.sh) 进程互相守护,杀掉一个生成一个新的在/usr/bin/目录,命名是十个字符 /etc/init.d/和/etc/rc.d/rcx.d/对应的软链接保证开机启动 首先ssh...
[持续更新]二进制部署Kubernetes v1.11.x(1.12.x) HA可选
本次采用二进制文件方式部署 不建议使用secureCRT这个ssh软件复制本篇博客内容的命令,因为它的部分版本对包含多条命令的处理结果并不完美,可能很多命令不是预期结果 本文命令里有些是输出,不要乱粘贴输入(虽然也没影响) 本文命令全部是在k8s-m1上执行 本文很多步骤是选择其一,别啥都不看一路往下复制粘贴 如果某些步骤理解不了可以上下内容一起看来理解 本次安裝的版本: Kubernetes v1.11.3 CNI v0.7.1 Etcd v3.3.9 Flannel v0.10.0 或者 Calico v3.1.3 Docker CE latest version(18.06) ...
Kubernetes v1.11.x HA全手动苦工安装教学
多master高可用 或者 单master的ansible部署方案 管理组件采用staticPod或者daemonSet形式跑的,宿主机os能跑docker应该本篇教程能大多适用安装完成仅供学习和实验 本次安裝的版本: Kubernetes v1.11.1 CNI v0.7.1 Etcd v3.3.9 Flannel v0.10.0 或者 Calico v3.1.3 Docker CE latest version(18.06) 不建议用docker 18.05 , docker CE 18.05有bind mount的bug 本次部署的网络信息: Cluster I...
利用travis同步gcr.io镜像到dockerhub
项目地址https://github.com/zhangguanzhang/gcr.io/tree/master 利用gcloud sdk去查看谷歌镜像站的镜像,获取每一个镜像的tag后改名推送到自己的dockerhub上面全部是shell思路,脚本一旦写完就需要不断的执行去同步了,所以借用travis去构建两个分支,一个master分支和一个构建分支travis触发构建后拉取仓库后,切换到构建分支,pull构建分支,然后同步镜像 脚本我写了两种https://github.com/zhangguanzhang/bash/tree/master/google_containers_syn...
记录一次线上k8s节点故障
邮件收到zabbix的告警,业务的网页登陆状态不是200,后面又自愈了 说明服务挂掉过一次,登陆到机器上发现集群有台节点状态是nodelost状态上去看到相关服务都挂掉了然后排查到根分区占满了,排查到是k8s日志堆满了/var/log/ 12345678910111213141516[root@cloudos02 ~]# df -hFilesystem Size Used Avail Use% Mounted on/dev/mapper/centos-root 219G 216G 0 100% /devtmpfs ...
kubernetes's Job总结和实战以及坑
Job有三种主要类型的 Job: Job的Pod运行完可以看到状态为Completed,低版本需要在get pod的时候添加-a或者--show-all才能看到job创建的pod 下面实例先创建一个固定完成数量2,并行数量4的Job12345678910111213141516171819202122232425262728293031[root@k8s-m1 k8s]# cat job.yml apiVersion: batch/v1kind: Jobmetadata: name: test-jobspec: completions: 2 parallelism: 4 temp...
kubernetes的PodAffinity的不解
官方文档来看是下面的说法,摘自官方文档https://kubernetes.io/docs/concepts/configuration/assign-pod-node/ An example of a pod that uses pod affinity: 1234567891011121314151617181920212223242526272829apiVersion: v1kind: Podmetadata: name: with-pod-affinityspec: affinity: podAffinity: requiredDuringSchedul...
[转载+修正]Kubernetes v1.10.x HA全手动苦工安装教学
转载自https://kairen.github.io/2018/04/05/kubernetes/deploy/manual-v1.10/作者文章的安装步骤文字是复制作者的1.8的安装步骤然后改的,安装过程变了部分,但是文字没有改正过来。 此过程我写了ansible安装部署方案,地址(一些文件下载不了的话可以去下面的github里找对应的文件) 多master高可用版 单master版 本文内容所有url都没改过,以下的添加的内容是我的建议和安装的经验 本文里如果有些范围不知道在哪台主机上执行请看前后命令都可以判断出,不清楚的请下面评论我会更新 以下我转载过来并修改+上我的提醒 管...
avatar
Zhangguanzhang
on the way