/* 解析:xie_minix */
/* 概述:
* 该代码在FB中提供桥接功能,不过他只是在以太网接口上工作,能提供多个逻辑桥
* ,我们称为组,组是由一组有相同组ID的接口组成,组ID的范围在1到2^16-1之间.
* 打开桥的功能是通过sysctl net.link.ether.bridge=1来启动的.
* 而sysctl net.link.ether.bridge_cfg是把以太网接口进行分组的命令,如:
* sysctl net.link.ether.bridge_cfg="vr0:1,vr1:1,fxp0:2,fxp1:2" 该命令的结果
* 为网卡vr0和vr1可以进行相互通信,fxp0和fxp1之间可以互相转发,等于是分为俩组了.
* 但目前的该项设置还不能进行多组成员和单向控制,即一块卡可以为多个组的成员和某卡
* 与另外卡的数据单向流动.在本文中,我将结合代码来讲解如何实现以上的功能.
* 在本代码中,重要的数据结构是cluster_softc,他主要是记录一个组的接口所连接的机器
* 的硬件地址,该地址数组存储采用HASH算法,据我所知,4.4版和OpenBSD版的HASH函数算法根本不同,
* 我们在下面的代码分析过程中将看到,我也将讲解两个版本的不同之处,说实话,该算法我根本看
* 不懂(OpenBSD),估计该算法应该有相关的论文描述.
* 代码的学习顺序:
* 由于在if_ethersubr.c中的ether_input函数接到一数据包后,先查看bridge功能是否打开,
* 即判断全局变量do_bridge是否为1(该变量是由上面讲的sysctl来控制的),为真的话就调用
* 本文中的函数bridge_in(详细可看我写的"ethernet网络驱动代码详解"),所以在本文中的
* bridge_in函数是第一个被调用的.该函数的作用是在上面讲的哪个重要的数据结构中查找
* 目标地址要通过本机的哪块卡发送,当然其中还涉及到多播,广播和是否将网卡进行分组以
* 及是否发送方,目的方经过的本机网卡是否被分在同组中等,在完成后,如果成功找到了发送
* 到目的地机器和本机直接相连的网卡就返回该网卡的ifnet结构指针(该结构可连接所描述的卡
* 的所有信息,见我所写的"关于FreeBSD4.4网络源代码接口层数据结构ifnet分析说明"),然后
* if_ethersubr.c中的ether_input函数还要查看是否是发给本机的包,如果不是则调用本文的
* bridge_forward函数进行数据的转发,这就是本文的主要功能.和交换机的原理有点类似.
* 性能分析:
* 由于在进行桥转发的过程中,是一定要使网卡工作在混杂模式的,所以进行网桥工作的卡要选购
* 性能好的网卡,我个人觉得intel,3com等比较适合,其他的如rtl8139卡最好只用来做实验,不要
* 用于实际的工作中(如果要我说明原因,请看看他的驱动程序你就知道了,但单机上网没关系),另
* 外,PCI漕内不要其他的卡(如声卡等),我们知道,网卡驱动程序目前在BSD中工作于中断驱动模式,
* 也就是说,进来一个包就能产生一个中断,而中断的系统开销有多达大家可以查看内核代码,总之
* 是非常大,如果你是四块卡,而且担任网桥及一些过滤功能的话,肯定数据包通过量会比较大,那么
* 中断产生的频率是平常一块卡的十几甚至是几十倍(平常的卡一个是数据量不大,另一个是不在混
* 杂模式下).要想桥工作的效率提高,建议去除本机处理针对本机的高层协议处理,如IP协议等,或改
* 写驱动程序为半轮询模式(使用timeout读卡的数据是否到达),OpenBSD中的bridge是真正的把bridge做
* 为一个设备来编写的,配备了标准的设备驱动程序,不过我还没有完全分析过,大概的看了看,觉得
* 比FreeBSD中的桥功能要强很多啊!
* 如何驱动一个网桥:
* 首先在内核配置文件中加入以下一行:
* option BRIDGE
* 注:我所使用的4.4版本是必须的,当前版本不需要这样,可以kld动态加载.
* 重新编译核心后重启,使用 sysctl net.link.ether.bridge=1启动桥功能.
* 如果想把网卡编组,使用 sysctl net.link.ether.bridge_cfg="设备:组号,设备:组号,..."即完成.
*//*
* 此处略去BSD版权申明
*/
#include <sys/param.h>
#include <sys/mbuf.h>
#include <sys/malloc.h>
#include <sys/protosw.h>
#include <sys/systm.h>
#include <sys/socket.h>
#include <sys/ctype.h>
#include <sys/kernel.h>
#include <sys/sysctl.h>
#include <net
/pfil.h>
#include <net/if.h>
#include <net/if_types.h>
#include <net/if_var.h>
#include <netinet/in_systm.h>
#include <netinet/in_var.h>
#include <netinet/if_ether.h>
#include <net/route.h>
#include <netinet/ip_dummynet.h>
#include <net/bridge.h>
/*--------------------*/
#define HASH_SIZE 8192 /* HASH表的大小,必须是2的权数 */
/*hash表,该表存放与本机各块卡相连机器的硬件地址*/
typedef struct hash_table {
struct ifnet * name; /*与某机器相连的本机网卡的ifnet结构指针*/
u_char etheraddr[6]; /*某台机器的硬件地址*/
u_int16_t used; /*这是一个是否在用(某机器是否活动)的标志*/
} bdg_hash_table ;
/*
*哈稀函数,我不理解他的算法,难道这样就不会产生同义字了吗?
*/
#define HASH_FN(addr) ( \
ntohs( ((u_int16_t *)addr)[1] ^ ((u_int16_t *)addr)[2] ) & (HASH_SIZE -1))
/*
* 下面的结构存储了本机的各卡的硬件地址.
*/
struct bdg_addr {
u_char etheraddr[6] ;/*本机卡的硬件地址*/
u_int16_t _padding ;/*这个成员还象没看到他用过*/
};
/*
* 这就是我们上面说的组,每块卡都有一个cluster_softc结构
*/
struct cluster_softc {
u_int16_t cluster_id; /*组的ID号*/
u_int16_t ports;/*顺序号*/
bdg_hash_table *ht;/*和该卡所连接的机器MAC地址哈稀表首指针*/
struct bdg_addr *my_macs; /* 本卡的硬件地址 */
};
extern struct protosw inetsw[]; /* 在netinet/ip_input.c中 */
extern u_char ip_protox[]; /* 在netinet/ip_input.c中 */
static int n_clusters; /* 组的数量*/
static struct cluster_softc *clusters; /*定义一个组的全局初始指针*/
#define BDG_MUTED(ifp) (ifp2sc[ifp->if_index].flags & IFF_MUTE) /*检查本机某卡是否桥启用*/
#define BDG_MUTE(ifp) ifp2sc[ifp->if_index].flags |= IFF_MUTE /*禁止本机的该卡桥功能*/
#define BDG_CLUSTER(ifp) (ifp2sc[ifp->if_index].cluster)/*根据卡在核心的唯一序号定位他的cluster_softc结构指针*/
#define BDG_SAMECLUSTER(ifp,src) \
(src == NULL || BDG_CLUSTER(ifp) == BDG_CLUSTER(src) ) /*俩卡是否在同一组里?*/
/*src==NULL代表数据包来自ether_output函数.*/
#ifdef __i386__
/*比较两个地址是否相同,硬件地址是6个字节,所以他先比较后面的长字(4个字节),再比较前一个字(2个字节)*/
#define BDG_MATCH(a,b) ( \
((u_int16_t *)(a))[2] == ((u_int16_t *)(b))[2] && \
*((u_int32_t *)(a)) == *((u_int32_t *)(b)) )
/*以下是比较广播地址*/
#define IS_ETHER_BROADCAST(a) ( \
*((u_int32_t *)(a)) == 0xffffffff && \
((u_int16_t *)(a))[2] == 0xffff )
#else
/* 非i386的机器不一定按长字或字对齐,所以按字节的方式比较. */
#define BDG_MATCH(a,b) (!bcmp(a, b, ETHER_ADDR_LEN) )
#define IS_ETHER_BROADCAST(a) (!bcmp(a, "\377\377\377\377\377\377", 6))
#endif
/*
*以下两句是调试用的.
*/
#define DDB(x) x
#define DEB(x)
static int bdginit(void);/*申明bridge初始化函数*/
static void parse_bdg_cfg(void);/*申明sysctl的字符参数分解函数*/
static int bdg_ipf; /* bridge中的IPFilter */
static int bdg_ipfw;
#if 0 /* 调试用的打印信息 */
static char *bdg_dst_names[] = {
"BDG_NULL ",
"BDG_BCAST ",
"BDG_MCAST ",
"BDG_LOCAL ",
"BDG_DROP ",
"BDG_UNKNOWN ",
"BDG_IN ",
"BDG_OUT ",
"BDG_FORWARD " };
#endif
/*
* 以下系统初始化几个结构
*/
static struct bdg_stats bdg_stats ;/*该结构用于统计信息*/
static struct callout_handle bdg_timeout_h ;/*用于保存timeout函数返回值*/
/* 把一网络接口加到组中,当然如果定义的组不存在的话,就建立一个该组.
*/
static struct cluster_softc *
add_cluster(u_int16_t cluster_id, struct arpcom *ac)
{
struct cluster_softc *c = NULL;/*这是准备用于返回的加入(没有该组就是建立的)组结构*/
int i;
for (i = 0; i < n_clusters ; i++) /*遍历所有组,n_clusters在加入后或建立后会++*/
if (clusters[i].cluster_id == cluster_id)/*有该组号吗?*/
goto found;/*有,跳过建立一个新的,直接到加入该组,此时i+全局变量clusters的内容是发现该组的cluster_softc指针*/
/* 我们要在此建立一个新的组*/
c = malloc((1+n_clusters) * sizeof (*c), M_IFADDR, M_NOWAIT | M_ZERO);/*分配这么多干吗,错了吗?没有,看后面就知道了,他进行了举家搬迁,把前面的都搬过来了*/
if (c == NULL) {/* 分配失败 */
printf("-- bridge: cannot add new cluster\n");/*应该加上,no memory说明*/
return NULL;
}
/*分配一个HASH表给该卡,要用掉蛮多内存的,即12*8K*/
c[n_clusters].ht = (struct hash_table *)malloc(HASH_SIZE * sizeof(struct hash_table),M_IFADDR, M_WAITOK | M_ZERO);
if (c[n_clusters].ht == NULL) {/*没内存了,很少出现此情况*/
printf("-- bridge: cannot allocate hash table for new cluster\n");
free(c, M_IFADDR);/*HASH表没分配到,当然前面分配到的cluster_soft