博客统计信息

51cto推荐博客
用户名:hahazhu0634
文章数:105
评论数:210
访问量:238656
无忧币:1519
博客积分:2694
博客等级:7
注册日期:2007-02-08

我的技术圈(2)

更多>>
备份与恢复cacti
2009-08-25 09:29:28
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://5ydycm.blog.51cto.com/115934/195479
[背景]在前两天公司的cacti监控服务器硬盘出现损坏,导致系统不停得重复启动,服务无法正常运行。心乱如麻啊,因为我也面临着近700台服务器的监控,这个数字,吓人。与是就想到了恢复,可数据还在这块硬盘里啊!怎么办呢?挂盘吧,问了一圈发现,我这台监控机是较差的一台Dell1850,没有与其类型相同的服务器,没办法,哎,就想再申请一台一样型号的机子做个bsd系统后,再挂。申请完后,IDC人帮我去领机子,我逞这时,下去拿硬盘,我带着不死心,又重新登录到freebsd的单用户下执行了fsck,哈哈,按着它一路的要求做下来,居然系统可以正常运行了,乐得我呀!但我知道,也不能指望它跑多久了,因为,我从网上看到好多说发生这种状况,已经判定为死刑了(而且我的判定是明智的,因为第二天,这台服务器正式完蛋了)。所以,我还是快把数据备份下来吧!
进入主题
[流程]
备份Cacti
(1)cacti文件的备份
这个简单就是备份cacti文件的目录(除rra目录外)
(2)mysql备份
mysqldump -p cacti  >/tmp/cacti.sql.20090823
(3)备份rra目录
dumprrd.sh
#!/bin/sh
rrddump="/usr/local/bin/rrdtool dump"
xmldir="/tmp/mysqlbackup/rraxml"
xmlbackup="/tmp/mysqlbackup/rrabak"
mysqlbackupDIR="/tmp/mysqlbackup"
eMailFile=$mysqlbackupDIR/email.txt
rrdpath="/usr/local/share/cacti/rra/"
DATE=`date +"%y-%m-%d"`

if [ ! -e ${xmldir} ];then
   mkdir ${xmldir}
fi

if [ ! -e ${xmlbackup} ];then
  mkdir ${xmlbackup}
fi

 
echo "" >$eMailFile
echo $(date +"%y-%m-%d %H:%M:%S") >> $eMailFile

#create rra => xml
for file in `find /usr/local/share/cacti/rra/ -mtime -2 | awk -F\/ '{print $NF}'`
  do
    ${rrddump} ${rrdpath}${file} > ${xmldir}/${file}.xml
  done

if [  `ls /tmp/mysqlbackup/rraxml/|wc -l`  -ge 2 ];then
   #tar backup
   cd ${mysqlbackupDIR}
   tar czvf ${xmldir}.${DATE}.tar.gz rraxml >/dev/null 2>&1
   mv ${xmldir}.${DATE}.tar.gz ${xmlbackup}

#delete file&dir
  if [ $? -eq 0 ];then
    echo "rraxml.${DATE}.tar.gz Backup Success!">> $eMailFile
    rm -fdr ${xmldir}
    mkdir ${xmldir}
    /usr/bin/find ${mysqlbackupDIR}/rrabak -type f -ctime +2 | /usr/bin/xargs /bin/rm >/dev/null 2>&1
    echo "Rra Backup is ok!" >> $eMailFile
  fi
else
   echo "Rra Backup is fail!" >> $eMailFile
fi
/soft/mail.pl "Cacti Backup of rra backup!"

恢复cacti
(1)安装cacti环境
这个不在话下,安装freebsd(为什么我选择它呢,因为,我觉得安装cacti很方便,哈哈。所以就选择这款操作系统了。)注意,
rrdtool的版本一定要高与或者等同与你原先备份的版本.所以,我需要升级ports,在升级ports前,我先把系统升级下。
升级freebsd
freebsd-update fetch install
重启
升级ports
portsnap fetch extract
重启
[后期更新ports
portsnap fetch update ]
过后,安装便可以参考
http://5ydycm.blog.51cto.com/115934/113305
在这里添加下,安装spine和monitor插件(注意,如果你原先没有monitor插件看这个,如果有的话,就没必要安装了,因为你已经备份了文件与数据库,就基本上支持了这个插件安装环境了)
spine安装
whereis cacti-spine
cd /usr/ports/net-mgmt/cacti-spine
make install clean

monitor插件的安装,需要先安装cacti-plugin-arch
从http://cactiusers.org/下载,过后解压
将其cacti-plugin-xxxxxx.diff 复制到cacti安装目录下,并且在其cacti安装目录下执行
patch -p1 -N < cacti-plugin-xxxxxx.diff
完了吗?没有,还有一步啊,
mysql cacti < pa.sql(需要操作)
<后期
到User Managemant=》admin下把Plugin Management选中
过后,就可以在cacti安装目录下的include/global.php
添加$plugins[] = 'monitor';
好了。环境基本ok了。>
(2)恢复cacti文件
简单,上传到网站目录下,如/usr/local/share/cacti
(3)恢复mysql的cacti数据库
mysql cacti <cacti.sql.20090823
GRANT ALL ON cacti.* TO cactiuser@localhost IDENTIFIED BY 'somepassword';(自己修改匹配你原来的用户)
flush privileges;
(4)恢复rra
restorerra.sh
#!/bin/sh
rrdrestore="/usr/local/bin/rrdtool restore"
xmldir=/tmp/rraxml/
for file in `find ${xmldir} | awk -F\/ '{print $NF}' | sed s/.xml//g`
  do
     echo $file
    ${rrdrestore} ${xmldir}${file}.xml /usr/local/share/cacti/rra/${file}
  done
chown -R cacti:cacti /usr/local/share/cacti/rra

OK,再给log授权。在这里提醒大家注意,权限的问题,不过,这些小的细节大家只要多注意事项观察日志都应该能解决掉的。

好了,到此为止,我已经将公司的监控服务器恢复好了,现在观察,运行不错。700台,9000个监控元素,只跑了60s,不错。大功告成,闪了。

本文出自 “坏男孩” 博客,请务必保留此出处http://5ydycm.blog.51cto.com/115934/195479

分享至
更多
一键收藏,随时查看,分享好友!
0人
了这篇文章
类别:系统监控技术圈()┆阅读()┆评论() ┆ 推送到技术圈返回首页

文章评论

 <<   1   2   >>   页数 ( 1/2 )  
2009-08-25 15:46:31
果然是实例吸引人呃
博主回复:
2009-08-25 22:03:48
吸引了你吧?哈哈。

2009-08-25 16:30:09
博主好牛啊,什么公司呀?管理700台服务器,真猛
博主回复:
2009-08-25 22:03:35
监控一台,与多台没什么区别,兄弟,想得太多了吧。呵呵。

2009-08-25 21:08:53
博主太强大,技术好强悍!学习!!
博主回复:
2009-08-25 22:02:55
谢谢夸奖,还没那么强壮!~

2009-08-27 07:38:31
700台?

全是linux服务器?

如何做一个整体的监控呢?

及时报警...及时处理?
博主回复:
2009-08-27 07:53:58
不是,cacti主要做历史数据的查询,及时监控与报警机制采用的是nagios和自己开发的监控工具。

2009-08-27 07:58:21
nagios....如何....做到全部集中管理你的所有服务器!!!
博主回复:
2009-08-27 08:05:26
不明白你想知道什么。。。

2009-08-27 08:31:45
你公司是使用nagios来监控你们的服务器的!

全是这个监控的吗?

如何做到集中监控!

所有的集中到一起来监控!
博主回复:
2009-08-27 08:38:11
cacti+nagios+自己开发的工具。分开监控的,如果做到集中也可以的,用nagios的集群(也就是要牵涉到被动监控模式了)

2009-08-27 12:36:43
谢谢!

2009-08-27 12:53:19
谢谢!
博主回复:
2009-08-27 13:37:43
真客气啊。不用谢。

 <<   1   2   >>   页数 ( 1/2 )  

发表评论            

【技术门诊】专家解析:软考重点难点及应试技巧
昵  称:
登录  快速注册
验证码:

请点击后输入验证码博客过2级,无需填写验证码

内  容: