查看: 6311|回复: 2

[转载] Linux下安装Greenplum实录

[复制链接]
论坛徽章:
407
紫蛋头
日期:2012-05-21 10:19:41迷宫蛋
日期:2012-06-06 16:02:49奥运会纪念徽章:足球
日期:2012-06-29 15:30:06奥运会纪念徽章:排球
日期:2012-07-10 21:24:24鲜花蛋
日期:2012-07-16 15:24:59奥运会纪念徽章:拳击
日期:2012-08-07 10:54:50奥运会纪念徽章:羽毛球
日期:2012-08-21 15:55:33奥运会纪念徽章:蹦床
日期:2012-08-21 21:09:51奥运会纪念徽章:篮球
日期:2012-08-24 10:29:11奥运会纪念徽章:体操
日期:2012-09-07 16:40:00
跳转到指定楼层
1#
发表于 2011-2-9 10:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
星期一21六Linux下安装Greenplum实录
12:00 下午

一、 配置系统环境




A. 以root用户登录系统




B. 编辑/etc/sysctl.conf,添加以下内容:
kernel.shmmax = 500000000

kernel.shmmni = 4096

kernel.shmall = 4000000000

kernel.sem = 250 64000 100 512

net.ipv4.tcp_tw_recycle=1

net.ipv4.tcp_max_syn_backlog=4096

net.core.netdev_max_backlog=10000

net.ipv4.conf.default.arp_filter=1

net.ipv4.conf.all.arp_filter=1

vm.overcommit_memory=2




C. 编辑/etc/security/limits.conf,添加以下内容:
* soft nofile 65536

* hard nofile 65536

* soft nproc 131072

* hard nproc 131072




D. 下载并安装greenplum-db。
wget http://192.168.47.2:8080/greenpl ... ld-1-RHEL5-i386.zip

unzip greenplum-db-3.3.6.1-build-1-RHEL5-i386.zip

rm -rf greenplum-db-3.3.6.1-build-1-RHEL5-i386.zip

./greenplum-db-3.3.6.1-build-1-RHEL5-i386.bin

rm -rf greenplum-db-3.3.6.1-build-1-RHEL5-i386.bin

cd /usr/local/greenplum-db




E. 修改/etc/sysconfig/network以修改本机名,修改以下内容:
HOSTNAME=mdw




F. 修改/etc/sysconfig/network-scripts/ifcfg-eth0使用固定IP(192.168.47.155),添加以下内容:
NAME=eth0

BOOTPROTO=static

IPADDR=192.168.47.155

NETMASK=255.255.255.0

USERCONTROL=no




G. 修改/etc/hosts以使segment节点也指向本机,(本机固定为192.168.47.155,sdw1和sdw2是两个segment节点,因为实验性质,而同样指向本机,)修改及添加以下内容:
192.168.47.155 mdw.localdomain mdw

127.0.0.1 localhost.localdomain localhost

127.0.0.1 sdw1.localdomain sdw1

127.0.0.1 sdw2.localdomain sdw2




H. 重启系统以使IP配置生效。




二、 添加Greenplum管理账户




A. 以root用户登录系统




B. 创建用户gpadmin,并将安装目录的所有权赋予gpadmin。
useradd gpadmin

passwd gpadmin

chown -R gpadmin /usr/local/greenplum-db

chgrp -R gpadmin /usr/local/greenplum-db




C. 创建grenplum目录,用于放配置文件及数据文件等,将目录的所有权赋予gpadmin。
mkdir /var/gp-db

chown -R gpadmin /var/gp-db

chgrp -R gpadmin /var/gp-db




三、 Greenplum Segment节点设置




A. 以gpadmin身份登录




B. 编辑~/.bashrc,添加以下内容:
source /usr/local/greenplum-db/greenplum_path.sh




C. 使该内容生效:
source ~/.bashrc




D. 创建配置文件目录:
mkdir /var/gp-db/conf




E. 新建/var/gp-db/conf/hosts,将master主机名和segment节点名都放进文件中(每个节点一行):
mdw

sdw1

sdw2




F. 根据hosts配置文件运行gpssh-exkeys工具:
gpssh-exkeys -f /var/gp-db/conf/hosts




G. 根据hosts配置文件运行gpssh命令(因为segement节点在本机,故忽略):
gpssh -f /var/gp-db/conf/hosts …




H. 根据hosts配置文件运行gpcheckos工具:
gpcheckos -f /var/gp-db/conf/hosts




I. 根据gpcheckos运行结果修改相关配置:(本次根据提示在/etc/sysctl.conf中添加以下内容:)
net.ipv4.ip_local_port_range = 1025 65535




J. 根据hosts配置文件运行gpcheckperf工具检测网络速度:
gpcheckperf -f /var/gp-db/conf/hosts -r N -d /tmp




K. 创建数据目录:
mkdir /var/gp-db/data

mkdir /var/gp-db/data/p1

mkdir /var/gp-db/data/p2

mkdir /var/gp-db/data/p3

mkdir /var/gp-db/data/m1

mkdir /var/gp-db/data/m2

mkdir /var/gp-db/data/m3




L. 根据hosts配置文件运行gpcheckperf工具测试数据目录:
gpcheckperf -f /var/gp-db/conf/hosts -r ds -D -d /var/gp-db/data/p1 -d /var/gp-db/data/p2 -d /var/gp-db/data/p3 -d /var/gp-db/data/m1 -d /var/gp-db/data/m2 -d /var/gp-db/data/m3




四、 初始化Greenplum




A. 以gpadmin身份登录




B. 拷贝一个Greenplum初始化文件范本为/var/gp-db/conf/gp_init_config:
cp /usr/local/greenplum-db/docs/cli_help/gp_init_config_example /var/gp-db/conf/gp_init_config




C. 根据实际情况修改/var/gp-db/conf/gp_init_config中的配置。(本次修改以下内容:)
ARRAY_NAME=”Ferrari’s Greenplum Database”

MACHINE_LIST_FILE=/var/gp-db/conf/hosts

declare -a DATA_DIRECTORY=(/var/gp-db/data/p1 /var/gp-db/data/p2 /var/gp-db/data/p3)

MASTER_HOSTNAME=mdw

MASTER_DIRECTORY=/var/gp-db/data/p1

MIRROR_PORT_BASE=60000

declare -a MIRROR_DATA_DIRECTORY=(/var/gp-db/data/m1 /var/gp-db/data/m2 /var/gp-db/data/m3)




D. 根据/var/gp-db/conf/gp_init_config初始化Greenplum:(设置地区语言为中文UTF-8:)
gpinitsystem -c /var/gp-db/conf/gp_init_config -n zh_CN.utf8




E. 初始化Greenplum的过程中可以第一次启动Greenplum,然后运行以下命令就可以进入Greenplum命令行(实际为PostgreSQL命令):
psql




F. 编辑~/.bashrc,添加以下内容:
export MASTER_DATA_DIRECTORY=/var/gp-db/data/p1/gp-1




G. 如果要允许外部访问Greenplum,需要以root用户打开防火墙的5432端口。编辑/etc/sysconfig/iptables,添加以下内容(需要添加在-A RH-Firewall-1-INPUT内容段中):
-A RH-Firewall-1-INPUT -m state –state NEW -m tcp -p tcp –dport 5432 -j ACCEPT




H. 以root用户重启防火墙服务使设置生效:
service iptables restart




五、 Greenplum相关知识




A. Greenplum虽然是安装完成了,但外部访问Greenplum还会遇到pg_hba.conf配置文件的阻挡。其他配置文件还包括postgresql.conf。具体可查询相关内容。




B. Greenplum数据库是基于PostgreSQL开源数据库的基础上的。命令行及SQL等具体可查询相关内容。




C. Greenplum的维护及管理也是一个很复杂的工作。具体可查询相关内容。




D. 以下是常规的Greenplum数据库启动与停止:
启动:gpstart

停止:gpstop

重启服务:gpstop -r

强制停止服务:gpstop -f -c




E. 当postgresql.conf与pg_hba.conf配置文件变后,需要重新装载修改后的参数,而且不停止数据服务:
gpstop -u
论坛徽章:
407
紫蛋头
日期:2012-05-21 10:19:41迷宫蛋
日期:2012-06-06 16:02:49奥运会纪念徽章:足球
日期:2012-06-29 15:30:06奥运会纪念徽章:排球
日期:2012-07-10 21:24:24鲜花蛋
日期:2012-07-16 15:24:59奥运会纪念徽章:拳击
日期:2012-08-07 10:54:50奥运会纪念徽章:羽毛球
日期:2012-08-21 15:55:33奥运会纪念徽章:蹦床
日期:2012-08-21 21:09:51奥运会纪念徽章:篮球
日期:2012-08-24 10:29:11奥运会纪念徽章:体操
日期:2012-09-07 16:40:00
2#
 楼主| 发表于 2011-2-9 10:47 | 只看该作者
greenplum数据库集群的安装实例--虚拟机的安装
greenplum数据库集群的安装实例
安装前简介
1、Greenplum
Greenplum数据引擎是为新一代数据仓库和大规模分析处理而建立的软件解决方案。
其最大的特点是不需要高端的硬件支持仍然可以支撑大规模的高性能数据仓库和商业智能查询。
在数据仓库、商业智能的应用上,尤其海量数据的处理方面性能极其优异。
2、greenplum数据库集群的简单认识
在安装greenplum数据库集群之前,简单认识一些集群的整体结构。集群的基层原理其实就是分布式理论,将复杂集中的任务分而治之。greenplum数据库集群分为master host 和 segment host两部分。master host只有一个,segment host可以有多个,多到多少我也不了解,网络瓶颈估计也是个问题吧。在安装greenplum数据库集群时,大部分工作都是主节点master host上完成的。

3、本安装实例中有 2 个segment host,每个host都是通过虚拟机实现的,2个虚拟机都安装在我  
个人的PC上,大家在学习时可以根据自己的情况而定。
  个人PC配置情况如下:
  OS: Windows XP sp3
  CPU: Intel Core(TM) 2 CPU 1.6GHz
  内存: 2G
  IP:172.16.17.230
  DNS:202.101.172.35
  在后面的Linux虚拟机网络设置中,IP 与个人的PC设置在同一网络下,关于虚拟机的网络设置也有些不明白的地方。

安装步骤:
1、虚拟机VirtualBox的安装
  本实例用的是VirtualBox-3.2.2,大家可以到VirtualBox的官网上下载更新的版本。
  VirtualBox的安装比较简单,按照安装提示就可以完成。
2、VirtualBox下Linux的安装
  本实例中安装了 2 台Linux虚拟机,名字分别为:rhel-1 和 rhel-2,作为 2 个segment host,通过镜像文件安装的。
  镜像文件为 rhel-server-5.4-i386-dvd.iso,大家在安装Linux时要保证是RedHat5以上的版本,
  好像是greenplum的要求,记得不清了。
  重点问题:
  a.linux全屏问题
    Linux虚拟机安装好了之后,会存在全屏问题,这个问题比较容易解决。在Linux虚拟机开启后,界面上会有“设备”选项,进入之后选择“安装增强功能”,Linux桌面将出现光盘图标,点击光盘图标进去后运行相应的可执行文件,之后重启即可。

b.VirtualBox安装好了之后,PC 的网络连接中会有VirtualBox host-only network的网络连接图标。为了设置Linux与外部网络的通信,需要一些网络设置。设置步骤如下:
    1)打开本地连接的属性
    2)进入属性的高级选项,设置Internel 连接共享,勾选第一个选项,并选择VirtualBox host-only network
    3)打开VirtualBox host-only network的网络设置,可以看到
        IP: 192.168.0.1
      子网掩码:255.255.255.0
      设置DNS:202.101.172.35 ,和PC的本地连接DNS 相同
c.linux虚拟机的网络设置,在VirtualBox界面上可以看到“设置”选项,进入后选择“网络”,VirtualBox有四种网络连接方式,本实例中将用到Host-only Adapter 和 Bridge Adapter 2种方式。对 2台Linux虚拟机分别进行如下的网络设置。
      设置步骤:
      1)在选择“网络”选项后,将看到四个网络连接
      2)在网络连接1 中选择连接方式 Host-only Adapter ,并勾选“启用网络连接”
      3)在网络连接1 中选择连接方式 Bridge Adapter ,并勾选“启用网络连接”

d.启动Linux虚拟机,进一步设置网络IP 。实例中的Linux都有图形化界面,所以是直接通过图形选项进行的。
      设置步骤:
      1)选择第一台虚拟机rhel-1的“system”-->administration-->network,将出现网络属性设置界面,可以看到 eth0 和 eth1 两个网卡
      2)双击 网卡eht0,进入属性设置界面,勾选“statically setIP address”
        在“general”页面设置
              IP : 192.168.56.101
              subnet mask :255.255.255.0
              gateway: 192.168.56.1
        在“route”页面设置
                Address: 192.168.56.101
                subnet mask :255.255.255.0
                gateway: 192.168.56.1
      3)双击 网卡eht1,进入属性设置界面,勾选“statically setIP address”
        在“general”页面设置
            IP : 172.16.17.101
            subnet mask :255.255.255.0
            gateway: 172.16.17.1
        在“route”页面设置
            Address: 172.16.17.101
            subnet mask :255.255.255.0
            gateway: 172.16.17.1
4)第二台虚拟机rhel-2 与第一台虚拟机rhel-1的设置类似
  网卡th0的“general”页面设置
            IP : 192.168.56.202
          subnet mask :255.255.255.0
          gateway: 192.168.56.1
      在“route”页面设置
        Address: 192.168.56.202
        subnet mask :255.255.255.0
        gateway: 192.168.56.1
  网卡eth1的“general”页面设置
          IP : 172.16.17.202
          subnet mask :255.255.255.0
          gateway: 172.16.17.1
      在“route”页面设置
        Address: 172.16.17.202
        subnet mask :255.255.255.0
        gateway: 172.16.17.1
5)选择第一台虚拟机rhel-1的“system”-->administration-->network,将出现网络属性设置界面,选择“DNS”选项,设置DNS: 202.101.172.35。
  第二台虚拟机rhel-2 与第一台虚拟机rhel-1的设置类似,设置DNS: 202.101.172.35。
6)在第一台虚拟机rhel-1下 打开终端,编辑 /etc/hosts
    添加代码行: 172.16.17.101  rhel-1.localdomain  rhel-1
    编辑 /etc/sysconfig/network
    修改代码: HOSTNAME=rhel-1
    在第二台虚拟机rhel-2下 打开终端,编辑 /etc/hosts
    添加代码行: 172.16.17.202  rhel-1.localdomain  rhel-2
    编辑 /etc/sysconfig/network
    修改代码: HOSTNAME=rhel-2
e.虚拟机的网络测试
    安装greenplum数据库集群时,大部分工作都是主节点master host上完成的。本实例中master host为IP:172.16.3.84在机器172.16.3.84 下通过 ping来测试Linux

使用道具 举报

回复
论坛徽章:
407
紫蛋头
日期:2012-05-21 10:19:41迷宫蛋
日期:2012-06-06 16:02:49奥运会纪念徽章:足球
日期:2012-06-29 15:30:06奥运会纪念徽章:排球
日期:2012-07-10 21:24:24鲜花蛋
日期:2012-07-16 15:24:59奥运会纪念徽章:拳击
日期:2012-08-07 10:54:50奥运会纪念徽章:羽毛球
日期:2012-08-21 15:55:33奥运会纪念徽章:蹦床
日期:2012-08-21 21:09:51奥运会纪念徽章:篮球
日期:2012-08-24 10:29:11奥运会纪念徽章:体操
日期:2012-09-07 16:40:00
3#
 楼主| 发表于 2011-2-9 10:50 | 只看该作者
greenplum数据库集群的安装实例(续)--greenplum集群的安装
3、greenplum集群的安装

1)greenplum集群软件greenplum官网上下载,本实例用到的版本是greenplum-db-4.0.0.0-build-1-RHEL5-i386.zip。安装greenplum数据库集群时,大部分工作都是主节点master host上完成的。本实例中的master host为:
      OS:Redhat Enterprise 5
      HOSTNAME:linux84
      IP:172.16.3.84
2) 所有安装机器(linux84, rhel-1, rhel-2)参数文件的修改
    编辑/etc/sysctl.conf,修改下列参数项:
    kernel.shmmax = 500000000
    kernel.shmmni = 4096
    kernel.shmall = 4000000000
    kernel.sem = 250 64000 100 512
    net.ipv4.tcp_tw_recycle=1
    net.ipv4.tcp_max_syn_backlog=4096
    net.core.netdev_max_backlog=10000
    vm.overcommit_memory=2            
    net.ipv4.ip_local_port_range = 1025 65535
编辑/etc/security/limits.conf,修改下列参数项:
    *  soft nofile 65536
    *  hard nofile 65536
    *  soft nproc 131072
    *  hard nproc 131072
3)修改主节点linux84的 /etc/hosts文件
添加代码行:
172.16.3.84      linux84
172.16.17.101    rhel-1
172.16.17.202    rhel-2

4)开始安装(172.16.3.84机器上安装)
a.root用户下创建greenplum管理员用户
  172.16.3.84机器
      # useradd gpadmin
      #passwd gpadmin
  172.16.17.101机器
      # useradd gpadmin
      # passwd gpadmin

  172.16.17.101机器
      # useradd gpadmin
      #passwd gpadmin
b.root用户下解压安装文件
  # unzip /app/greenplum/greenplum-db-4.0.0.0-build-1-RHEL5-i386.zip
  提示安装目录,输入:/app/greenplum/gp4.0
  然后:
  # mkdir /app/greenplum/masterdata
  # chown -R gpadmin.gpadmin  /app/greenplum
c.172.16.3.84机器上创建如下文件
  /home/gpadmin/all_host
  文件内容:
    172.16.3.84        
    172.16.17.101      
    172.16.17.202      
    /home/gpadmin/seg_host
    172.16.17.101      
    172.16.17.202
d.172.16.3.84机器 环境变量设置
  # source  /app/greenplum/gp4.0/greenplum-db/greenplum_path.sh
  将文件greenplum-db/greenplum_path.sh中的环境变量
  添加到pgadmin的user’s startup shell profile(such as /home/gpadmin/.bashrc)中,
  然后,
  $ source~/.bashrc
e. 172.16.3.84机器上交换ssh keys
  在root用户运行命令:
  # gpssh-exkeys  -f  /home/gpadmin/all_host
  在gpadmin用户运行命令:
  $ gpssh-exkeys  -f  /home/gpadmin/all_host
f.创建segment host 的安装包并传送到segment host
  # su - gpadmin
  $ gtar -cvf  /home/gpadmin/gp.tar  /app/greenplum/gp4.0
  $ gpssh -f /home/gpadmin/seg_host
    =>mkdir /app/greenplum
    =>mkdir /app/greenplum/segdata
    =>chown -R gpadmin.gpadmin /app/greenplum
  $ gpscp -f  /home/gpadmin/seg_host  /home/gpadmin/gp.tar=:/app/greenplum
  $ gpssh -f  /home/gpadmin/seg_host
  =>gtar --directory  /app/greenplum  -xvf  /app/greenplum/gp.tar
  =>ln  -s  /app/greenplum/gp4.0  /app/greenplum/greenplum-db
  =>chown -R gpadmin.gpadmin  /app/greenplum
  =>rm  /app/greenplum/gp.tar
g.所有机器的时间同步
  $ gpssh-f    /home/gpadmin/all_host  -v  date
  $ gpssh-f  /home/gpadmin/all_host  -v  ntpd
h.os的检查验证
  # su  - gpadmin
  $ pcheckos -f  /home/gpadmin/all_host
  如果验证未通过,则需根据提示进行相应配置,时间未同步可以忽略。

i.创建greenplum 安装配置文件
  # su - gpadmin
  $ cp  $GPHOME/docs/cli_help/gp_init_config_example  /home/gpadmin/gp_init_config
  $ vi gp_init_config
文件 gp_init_config 内容如下:
  ARRAY_NAME="Greenplum"
  MACHINE_LIST_FILE=/home/gpadmin/seg_host
  SEG_PREFIX=gpseg
  PORT_BASE=50000
  declare-a DATA_DIRECTORY=(/app/greenplum/segdata  /app/greenplum/segdata)
  MASTER_HOSTNAME=mdw1
  MASTER_DIRECTORY=/app/greenplum/masterdata
  MASTER_PORT=5432
  TRUSTED SHELL=ssh
  CHECK_POINT_SEGMENT=8
  ENCODING=UNICODE
j.初始化数据库
# su - gpadmin
$ gpinitsystem  -c /home/gpadmin/gp_init_config
=>Continue with Greenplum creation?  y
=>Greenplum Database instance successfully created.

k.将MASTER_DATA_DIRECTORY加入环境中
  修改 gpadmin用户的.bash_profile以及/etc/profile,加入
  MASTER_DATA_DIRECTORY=/app/greenplum/masterdata
  export MASTER_DATA_DIRECTORY
整个安装过程完成。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表