一道逻辑题 - 我拿走了哪个数

原文链接：http://www.cnblogs.com/baiyanhuang/archive/2010/06/23/1763981.html

有 1 到 10000 共 10000 个数，如果我从中随机拿走一个数，你如何知道我拿走了哪个？

相信很多人看过这道题，并知道答案，这几天和同事聊天时听到了这个问题，因为有过自己的思考过程，不妨记录下来。说是逻辑题，其实也算是一道算法题，同事先讲了下他被面试中的思维过程：

先把 10000 个数相乘，然后再将拿走一个数之后的 9999 个数相乘，两者相除即可。

这个算法是正确的，但是会有两个潜在的问题：
- 如此多的数相乘，其范围必然会超出系统提供的数据类型支持，当然你可以实现自己的大数表示的算法，但那样性能必然有影响。
- 假设扩展一下题目，提供的数组中有 0 的话，乘法就不可用了。
针对前面提出的问题，同事想到了使用加法，先求出 10000 个数的和，再减去 9999 个数的和。

这样数据不会溢出，而且加法的效率比乘法也要高很多，即使数据中包含 0，也没有任何问题。

然后就过关了，自己回去之后思考了一下，觉得还可以扩展，假设所有的数加起来之后仍然会溢出，那该如何处理，比如从 1 到 (2^64-1)，于是想到了位操作，与、或，异或中，要数异或最为神奇，代入一看，果然合适: 先将所有的数异或起来，然后将拿走一个数之后的数异或起来，两者结果再异或，便是拿走的那个数。

我用 a,b,c,d 4 个数来做演示，因为异或符合结合律和交换律(你可以用 0,1 试一下)，于是：

a^b^c^d = (a^b^c)^d
d = (a^b^c^d)^(a^b^c)

此处用异或的好处在于

不会溢出
异或的速度要快于加法

扩展一下题目，如果提供的不是整数，而是浮点数，会有问题吗？当然没有，因为是在位级别上操作，无论是整数还是浮点数，在这个算法看来，都是一堆位，处理起来没有什么差别。

再扩展一下题目，如果提供的数本身就超出了内置类型的表示范围，如在 1 到 2^128，该如何处理？这个问题是在写这篇文章的过程中想到的，暂时没有好的办法。

继续阅读关于算法的文章