在大中型企业信息系统中,对客户端pc的管理,往往是容易出现问题的环节。因此,很多大公司引入了各种分布式的管理系统,例如防病毒方面的norton antivirus,blackice防火墙,微软的 sms (system management server),等等,这些系统都会在客户端安装相应的客户端软件,一般都是以服务的形式出现,但是由于种种原因,这些服务会停止运行或者该客户机根本没有安装这些客户端服务,这样管理系统就会出现疏漏,有可能造成问题,如因无法防御病毒而成为病毒源,无法为该客户端发布软件,无法管理客户pc等等。在此,我们提供一个方案,可以定时按照ip地址扫描网络,报告出特定的服务的状态。
这个方案使用了microsoft.net技术,同时也用到了.net framework中的ado.net ,wmi management,xml。其核心是一个由vb.net写的程序以及它的两个配置文件,配置文件为xml格式,该程序按ip扫描网络,得到每个系统的服务 的状态,如果ip地址没有对应系统,则忽略该ip,针对没有安装服务或服务停止的系统我们在另一个线程中运行nbtstat命令,得到其机器名,用户名,mac地址域等信息,以便我们找到机器解决问题。其次为了保存扫描的结果,我们需要一个很小的数据库ms-access或ms-sql server都可以,本文使用sql2000 。最后为了呈现出扫描的结果,以便我们采取行动,这里我们使用网页的形式把数据库中的结果展现出来。
1. vb.net程序
该程序使用两个xml格式的配置文件,当程序启动时会读入这些配置。其中一个文件定义了需要扫描的网段,包括排除在外的地址段。另一个文件定义了连接数据库的信息,以及数据表的定义。这两个文件的内容如下:
<iplist>
<ip lanid="192.168.100." ><exp l=”1” h=”30”/></ip>
<ip lanid="192.168.101." />
<ip lanid="192.168.102." />
<ip lanid="192.168.103." />
<ip lanid="192.168.104." ><exp l=”1” h=”40”/></ip>
</iplist>
该文件定义将要扫描5个网段,其中两个网段有些地址需要排除在外(分配给打印机等设备),对于192.168.100段,我们排除从1到30,对于192.168.104段我们排除1到40。
<dbinfo>
<server>dbserver</server>
<database>db</database>
<uid>report</uid>
<pwd>report</pwd>
<service table=”service”>service</service>
</dbinfo>
该文件定义了连接数据库所需的信息
tag meaning
<server> scanservice数据库的服务器名
<database> scanservice数据库名
<uid> 用于更新scanservice数据库的数据库用户名
<pwd> 用于更新scanservice数据库的数据库用户的密码
<service> 该tag的 inner 定义了我们希望扫描的service的名字,
这里我们假定希望扫描服务名为service。
该tag的属性定义了数据库中表名,该表用于保存扫描结果。
‘首先我们定义一个类,主要用于得到某个ip地址的service的状态信息,并在服务状态不正常时触发另一线程得到该系统的详细信息。
imports system.serviceprocess
imports system.xml
imports system.threading
public class getstatus
private iservicename as string ‘服务的名称
private imachineip as string ‘ip地址
private itable as string ‘在dateset中的表名
‘构造函数
sub new(byval ip as string, byval svcname as string, byval updatetable as string)
imachineip = ip
iservicename = svcname
itable = updatetable
end sub
‘每个线程所运行的方法,用于得到服务的状态,如果状态不正常则触发另一线程得到该ip的信息
sub getstausf()
dim servicep as new servicecontroller() ‘实例化一个servicecontroller类
servicep.machinename = imachineip
servicep.servicename = iservicename
dim myrow as datarow
dim status as string
dim run as boolean = false
myrow = ds.tables(itable).newrow
try
if servicep.status.tostring <> "running" then
status = servicep.status.tostring‘如果状态不是running则将状态赋予字符串变量
else
run = true ‘如果状态为running,则不做任何事
end if
catch er as exception ‘以下处理取得状态时候发生的异常
status = left(er.message, 35)
if instr(status, "service control manager") = 0 then
status = "not installed or open service failed" ‘没有安装该服务
elseif instr(er.message, "manager") > 0 then
status = "can not detected" ‘服务的状态不可得
end if
end try
servicep.close() ‘关闭servicecontroller实例
‘以下判断如果状态不是running,则记录该系统,并触发线程得到它的详细信息。
if not run then
myrow("msg") = status
myrow("ip") = imachineip
synclock gettype(addrow) ‘为保证多线程情况下,对dataset只有一个写操作,锁定addrow类
dim addrowins as new addrow(myrow) ‘将ip和状态通过我们自己写的addrow类插入dataset
end synclock
‘触发另一线程取得机器信息
dim hostinfo2 as new hostinfo(imachineip)
dim hostthr2 as new thread(new threadstart(addressof hostinfo2.sysinfo))
hostthr2.start()
synclock gettype(hostinfothreadcounter)
hostinfothreadcounter.counter += 1 ‘启动线程数加1
end synclock
end if
synclock gettype(stoppcounter)
stopthr.addstop()
end synclock
end sub
end class
‘该类只有一个方法,就是将停止的线程数减1
class stoppcounter
sub addstop()
threadcounterstopped = threadcounterstopped + 1
end sub
end class
‘此类用于将已有的行插入dataset
class addrow
‘第一个构造函数,以构造好的行为输入参数
sub new(byval row as datarow)
try
ds.tables(0).rows.add(row)
catch ee as exception
end try
end sub
‘第二个构造函数,以机器名用户名等字符串为参数,更新已有的行
sub new(byval ip as string, byval user as string, byval hostname as string, byval mac as string, byval domain as string, byval timeout as char)
dim rowtimeout as datarow
try
for each rowtimeout in ds.tables(0).select("ip=" & ip & "")
rowtimeout.item("lastuid") = user
rowtimeout.item("name") = hostname
rowtimeout.item("mac") = mac
rowtimeout.item("domain") = domain
rowtimeout.item("timeout") = timeout set timeout flag to this item
exit for just run once
next
catch er as exception
end try
end sub
end class
‘由于篇幅限制,这里省略了根据ip取得机器信息的类的代码。
imports system.threading ‘用于支持多线程
imports system.xml ‘用于分析xml格式的参数文件
imports system.data ‘用于保存结果到数据库
module module1
public ds as new dataset()
public conn1 as sqlclient.sqlconnection ‘数据库连接
public ipf as string ‘ip列表文件名
public dbf as string ‘数据库信息文件
public threadcounterstopped as integer
public stopthr as new stoppcounter()
sub main() ‘程序主程序
dim machineip as string
dim iplistf as new xml.xmldocument()
dim iplist as xml.xmlnode
dim ipitem as xml.xmlnode
dim dbinfof as new xml.xmldocument()
dim dbinfo as xml.xmlnode
dim lanid as string
dim i as integer
dim timestart as integer
dim threadcounterstarted as integer
threadcounterstarted = 0
threadcounterstopped = 0
dim server as string
dim database as string
dim uid as string
dim pwd as string
dim table as string
dim connstr, connstr1 as string
dim servicename as string
dim purgestr as string
try
dbinfof.load(dbf) ‘读取数据库信息文件
catch nodb as exception
msgbox(nodb.message & "wrong db info file name.")
exit sub
end try
try
iplistf.load(ipf) ‘读取ip列表文件
catch noip as exception
msgbox(noip.message & "wrong ip list file name.")
exit sub
end try
‘分析数据库信息文件
dbinfo = dbinfof.childnodes(0)
server = dbinfo.childnodes(0).innertext
database = dbinfo.childnodes(1).innertext
uid = dbinfo.childnodes(2).innertext
pwd = dbinfo.childnodes(3).innertext
servicename = dbinfo.childnodes(4).innertext
table = dbinfo.childnodes(4).attributes(0).value
‘根据分析所得,构造连接字符串
connstr1 = "server=" & server & ";database=" & database & ";uid=" & uid & ";password=" & pwd
conn1 = new sqlclient.sqlconnection(connstr1) ‘实例化数据库连接
conn1.open() ‘打开数据库连接
dim sa as sqlclient.sqldataadapter = new sqlclient.sqldataadapter("select * from " & table, conn1)
dim combu as new sqlclient.sqlcommandbuilder(sa)
sa.fill(ds, table) ‘填充dataset
ds.clear() ‘清空旧的数据
dim ipaddress as string
‘分析ip列表文件
iplist = iplistf.childnodes(0)
dim ai as integer
dim ipexcepcount as integer
dim ipexcep as xml.xmlnode
for each ipitem in iplist.childnodes
dim excep(2, 83) as integer
lanid = ipitem.attributes(0).value‘得到网络id
for i = 2 to 254 ‘从2到254,根据每个网络id构造ip地址
ai = 0
‘以下判断是为了跳过保留地址段
if ipitem.haschildnodes then
ipexcepcount = ipitem.childnodes.count
redim excep(2, ipexcepcount – 1)
for each ipexcep in ipitem.childnodes
excep(0, ai) = cint(ipexcep.attributes(0).value)
excep(1, ai) = cint(ipexcep.attributes(1).value)
ai = ai + 1
next
end if
for ai = 0 to ipexcepcount – 1
if i >= excep(0, ai) and i <= excep(1, ai) then
console.writeline("跳过保留地址: " & lanid & i.tostring)
goto skipip
end if
next
machineip = lanid & i.tostring ‘ip地址
‘以下触发线程以,得到服务状态
dim getst as new getstatus(machineip, servicename, table)
dim getstthread as new thread(new threadstart(addressof getst.getstausf))
getstthread.start()
threadcounterstarted = threadcounterstarted + 1‘启动线程数加1
console.writeline("线程" & machineip & " 启动。检测 " & servicename)
‘每启动100个线程,程序主线程停止15秒,避免太多线程造成内存溢出
if (threadcounterstarted mod 100) = 0 then
console.writeline("等待 …….")
thread.currentthread.sleep(15000)
gc.collect() force garbage collection to aviod outofmemory when run with long ip list
end if
skipip:
next
next
console.writeline("exiting program …") ‘所有线程都已触发
finish:
thread.currentthread.sleep(5000) ‘以下程序等待所有线程结束
gc.collect()
if threadcounterstopped = threadcounterstarted and hostinfothreadcounter.counter = hostinfothreadcounter.counterstop then‘如果触发线程等于结束线程
dim row as data.datarow
for each row in ds.tables(table).rows
row.item("systime") = now
next
purgestr = "delete " & table
dim com1 as new sqlclient.sqlcommand(purgestr, conn1)
com1.executenonquery() ‘删除旧记录
sa.insertcommand = combu.getinsertcommand
sa.update(ds, table) 将新记录写入数据库
else
goto finish goto finish and wait another 30 seconds
end if
end sub
可以利用如下命令在dos窗口启动该程序。
scanservice –i iplist.xml –d dbinfo.xml
2. scanservice 数据库
该数据库保存保存程序运行结果,以便用web等方式展现出来。以下是建立表的脚本,包含域名,用户名,机器名,ip以及服务状态。
create table [dbo].[service] (
[ip] [varchar] (50) null ,
[状态] [varchar] (50) null ,
[用户名] [varchar] (50) null ,
[机器名] [varchar] (50) null ,
[mac地址] [varchar] (50) null ,
[域] [varchar] (50) null ,
[超时] [varchar] (10) null ,
[时间安] [datetime] (8) null ,
)
总结:
以上是一个完整的方法,也是比较简单明晰的解决方法,如果要求技巧和性能的话,还有一些地方可以做些改进,比如对线程池的使用。另外还有一些方面需要大家自己完成,比如将数据库中的信息以web的方式展现出来。