|
|
如果只排除完全重单,在5000万条话单以下的情况下,可以使用数据库排重。
如果要排除交叉话单的话,则必须在内存中进行排重。内存可以建立共享内存,这样跨文件的
的问题就可以解决了。只是内存的大小是有限制的,可以考虑在内存中话单达到一定的条数是
将共享内存清除,重新建立。如果能保证话单文件的根据时间的的顺序进行处理时,就可以在
删除共享内存时,将临近几天的话单读出来,重建时在将其读入。这样基本上可以解决排重问题。
只是,这种排重方式,因为考虑目前的程序的实时性,格式化后的话单马上需要计入话单表,不能对重单和交叉单的第一条进行操作。
一家之言,请大家讨论。 |
|