浅谈double dispatch (双分派) 之 vistor pattern

double dispatch(双分派) 是 multi-dispatch(多分派)的特例,由于 Visitor 模式涉及的
是 double dispatch(双分派),因此这里仅仅讨论 double dispatch(双分派)的内容。实际上
double dispatch(双分派)是一种很经典的技术,但是当前的主流的面向对象程序设计语言
(例如 C++/Java/C#等)都并不支持多分派,仅仅支持单分派(single dispatch)。

单分派(single dispatch)的含义比较好理解,单分派(single dispatch)就是说我们在选
择一个方法的时候仅仅需要根据消息接收者(receiver)的运行时型别(Run time type)。实际上这也就是我们经常提到的多态的概念(当然 C++中的函数重载也是 Single dispatch 的一种实现方式)。举一个简单的例子,我们有一个基类 B, B 有一个虚方法 (可被子类foverride),D1 和 D2 是 B 的两个子类,在 D1 和 D2 中我们覆写(override)了方法 f。这样我们对消息f 的调用,需要根据接收者 A 或者 A 的子类 D1/D2 的具体型别才可以确定具体是调用 A 的还是 D1/D2 的 f 方法。
double dispatch (双分派)则在选择一个方法的时候,不仅仅要根据消息接收者(receiver)的运行时型别(Run time type),还要根据参数的运行时型别(Run time type)。当然如果所有参数都考虑的话就是 multi-dispatch(多分派)。也举一个简单的例子,同于上面单分派中例子,A 的虚方法 f 带了一个 C 型别的参数,C 也是一个基类,C 有也有两个具体子类 E1和 E2。这样,当我们在调用消息 f 的时候,我们不但要根据接收者的具体型别(A、D1、D2),还要根据参数的具体型别(C、E1、E2),才可以最后确定调用的具体是哪一个方法 f。

遗憾的是,当前的主流面向对象程序设计语言(例如 C++/Java/C#等)都并不支持双分派(多分派)
,仅仅支持单分派。为了支持双分派(多分派),一个权宜的方法就是借助 RTTI和 if 语言来人工确定一个对象的运行时型别,并使用向下类型转换(downcast)来实现。一个常见的例子就是,我们取得对象的 RTTI 信息,然后 if 对象是某个具体类,则执行一部分操作,else 属于另外的类则执行另外的操作…。然而我们知道,RTTI 一是占用较多的时间和空间,并且不是很安全(经常可能在 downcast 中出现 exception)。

以上的分析主要是关注于单分派和双分派(多分派),好像和 Visitor 模式没有什么关系。
其实不然,要真正理解 Visitor 模式就必须要理解单分派和双分派(多分派)的含义。再审
视一下 Visitor 模式的实现,Visitor 模式的实现有两个关键的方法:
1)Visitor 的 visit 方法;
2 ) Element 的 Accept 方 法 。
在 给 出 的 Visitor 的 实 现 中 , 我 们 会 针 对 不 同 Element( ConcreteElementA/ConcreteElementB ) 提 供 不 同 的 接 口(VisitConcreteElementA/VisitConcreteElementB),当然我们可以对这个接口进行简化,简化的实现有两个选择:

  1. 采用函数重载的方式进行。即 Visitor 及其子类只提供一个 Visit 的接口,但是有两
    个函数体,Visit(ConcreteElementA* elm)和 Visit(ConcreteElementB* elm),这样通过函
    数重载的方式可以简化接口,但是不能改变实现。
  2. 通过 RTTI 实现。我们不通过函数重载的方式实现,而使用 RTTI 的方式实现,我们对 Visitor 极其子类仅提供 Visit 接口,该 Visit 接口的实现模式为:
void Visitor::Visit(Element* elm)
{if (typeid(*elm) == typeid(ConcreteElementA)){//提供对于 ConcreteElementA 的访问实现cout<<(typeid(*elm)).name()<<endl;cout<<"i will visit element A"<<endl;}else if (typeid(*elm) == typeid(ConcreteElementB)){//提供对于 ConcreteElementB 的访问实现cout<<(typeid(*elm)).name()<<endl;cout<<"i will visit element B"<<endl;}else if (typeid(*elm) == typeid(Element)){//可以在这里提供对所有 Element 的默认的访问实现cout<<(typeid(*elm)).name()<<endl;cout<<"i will visit element"<<endl;}
}

Visitor 的子类的实现模式也是这样。当然,这种实现方式我也并不认同:一是 RTTI 固有的时间和空间的消耗,二是通过这种 if 的选择硬编码正是 OO 设计中所力求避免和改进的。因此虽然通过这种方式接口简单了,实现到一个函数中进行了,得到的结果未必是我们所期望的。
在 Visitor 模式的实现中,Element 的 Accept 操作则是一个双分派的操作。

void ConcreteElementA::Accept(Visitor* vis)
{vis->VisitConcreteElementA(this);cout<<"visiting ConcreteElementA..."<<endl;
}

要具体确定是哪一个 Accept 操作,至少需要两个方面的信息:
一是接受消息者(Element或其子类)的具体型别;
二是参数 Visitor 的具体型别(Visitor 或其子类)。
而这里的双分派实际上是通过以下的方式实现的:
1)在 Element 类层次里面,通过多态实现(也就是单分派);
2)在 Visitor 类层次中,我们根据所有的 Element 具体类定义对应的 visit 操作,也就是 VisitConcreteElementA ()和 VisitConcreteElementB ()操作。
当然可以通过上面给出 RTTI的方式实现,但是这种方式我们并不提倡。

浅谈double dispatch (双分派) 之 vistor pattern

double dispatch(双分派) 是 multi-dispatch(多分派)的特例,由于 Visitor 模式涉及的
是 double dispatch(双分派),因此这里仅仅讨论 double dispatch(双分派)的内容。实际上
double dispatch(双分派)是一种很经典的技术,但是当前的主流的面向对象程序设计语言
(例如 C++/Java/C#等)都并不支持多分派,仅仅支持单分派(single dispatch)。

单分派(single dispatch)的含义比较好理解,单分派(single dispatch)就是说我们在选
择一个方法的时候仅仅需要根据消息接收者(receiver)的运行时型别(Run time type)。实际上这也就是我们经常提到的多态的概念(当然 C++中的函数重载也是 Single dispatch 的一种实现方式)。举一个简单的例子,我们有一个基类 B, B 有一个虚方法 (可被子类foverride),D1 和 D2 是 B 的两个子类,在 D1 和 D2 中我们覆写(override)了方法 f。这样我们对消息f 的调用,需要根据接收者 A 或者 A 的子类 D1/D2 的具体型别才可以确定具体是调用 A 的还是 D1/D2 的 f 方法。
double dispatch (双分派)则在选择一个方法的时候,不仅仅要根据消息接收者(receiver)的运行时型别(Run time type),还要根据参数的运行时型别(Run time type)。当然如果所有参数都考虑的话就是 multi-dispatch(多分派)。也举一个简单的例子,同于上面单分派中例子,A 的虚方法 f 带了一个 C 型别的参数,C 也是一个基类,C 有也有两个具体子类 E1和 E2。这样,当我们在调用消息 f 的时候,我们不但要根据接收者的具体型别(A、D1、D2),还要根据参数的具体型别(C、E1、E2),才可以最后确定调用的具体是哪一个方法 f。

遗憾的是,当前的主流面向对象程序设计语言(例如 C++/Java/C#等)都并不支持双分派(多分派)
,仅仅支持单分派。为了支持双分派(多分派),一个权宜的方法就是借助 RTTI和 if 语言来人工确定一个对象的运行时型别,并使用向下类型转换(downcast)来实现。一个常见的例子就是,我们取得对象的 RTTI 信息,然后 if 对象是某个具体类,则执行一部分操作,else 属于另外的类则执行另外的操作…。然而我们知道,RTTI 一是占用较多的时间和空间,并且不是很安全(经常可能在 downcast 中出现 exception)。

以上的分析主要是关注于单分派和双分派(多分派),好像和 Visitor 模式没有什么关系。
其实不然,要真正理解 Visitor 模式就必须要理解单分派和双分派(多分派)的含义。再审
视一下 Visitor 模式的实现,Visitor 模式的实现有两个关键的方法:
1)Visitor 的 visit 方法;
2 ) Element 的 Accept 方 法 。
在 给 出 的 Visitor 的 实 现 中 , 我 们 会 针 对 不 同 Element( ConcreteElementA/ConcreteElementB ) 提 供 不 同 的 接 口(VisitConcreteElementA/VisitConcreteElementB),当然我们可以对这个接口进行简化,简化的实现有两个选择:

  1. 采用函数重载的方式进行。即 Visitor 及其子类只提供一个 Visit 的接口,但是有两
    个函数体,Visit(ConcreteElementA* elm)和 Visit(ConcreteElementB* elm),这样通过函
    数重载的方式可以简化接口,但是不能改变实现。
  2. 通过 RTTI 实现。我们不通过函数重载的方式实现,而使用 RTTI 的方式实现,我们对 Visitor 极其子类仅提供 Visit 接口,该 Visit 接口的实现模式为:
void Visitor::Visit(Element* elm)
{if (typeid(*elm) == typeid(ConcreteElementA)){//提供对于 ConcreteElementA 的访问实现cout<<(typeid(*elm)).name()<<endl;cout<<"i will visit element A"<<endl;}else if (typeid(*elm) == typeid(ConcreteElementB)){//提供对于 ConcreteElementB 的访问实现cout<<(typeid(*elm)).name()<<endl;cout<<"i will visit element B"<<endl;}else if (typeid(*elm) == typeid(Element)){//可以在这里提供对所有 Element 的默认的访问实现cout<<(typeid(*elm)).name()<<endl;cout<<"i will visit element"<<endl;}
}

Visitor 的子类的实现模式也是这样。当然,这种实现方式我也并不认同:一是 RTTI 固有的时间和空间的消耗,二是通过这种 if 的选择硬编码正是 OO 设计中所力求避免和改进的。因此虽然通过这种方式接口简单了,实现到一个函数中进行了,得到的结果未必是我们所期望的。
在 Visitor 模式的实现中,Element 的 Accept 操作则是一个双分派的操作。

void ConcreteElementA::Accept(Visitor* vis)
{vis->VisitConcreteElementA(this);cout<<"visiting ConcreteElementA..."<<endl;
}

要具体确定是哪一个 Accept 操作,至少需要两个方面的信息:
一是接受消息者(Element或其子类)的具体型别;
二是参数 Visitor 的具体型别(Visitor 或其子类)。
而这里的双分派实际上是通过以下的方式实现的:
1)在 Element 类层次里面,通过多态实现(也就是单分派);
2)在 Visitor 类层次中,我们根据所有的 Element 具体类定义对应的 visit 操作,也就是 VisitConcreteElementA ()和 VisitConcreteElementB ()操作。
当然可以通过上面给出 RTTI的方式实现,但是这种方式我们并不提倡。