C# 中居然也有切片语法糖,太厉害了

605 阅读4分钟

一:背景

1. 讲故事

昨天在 github 上准备找找 C# 9 又有哪些新语法糖可以试用,不觉在一个文档上看到一个很奇怪的写法: foreach (var item in myArray[0..5]) 哈哈,熟悉又陌生,玩过python的朋友对这个 [0..5] 太熟悉不过了,居然在 C# 中也遇到了,开心哈,看了下是 C# 8 的新语法,讽刺讽刺,8 都没玩熟就搞 9 了,我的探索欲比较强,总想看看这玩意底层是由什么支撑的。

二:.. 语法糖的用法

从前面介绍的 myArray[0..5] 语义上也能看出,这是一个切分array的操作,那到底有几种切分方式呢? 下面一个一个来介绍,为了方便演示,我先定义一个数组,代码如下:


var myarr = new string[] { "10", "20", "30", "40", "50", "60", "70", "80", "90", "100" };

1. 提取 arr 前3个元素

如果用 linq 的话,可以用 Take(3),用切片操作的话就是 [0..3], 代码如下:


        static void Main(string[] args)
        {
            var myarr = new string[] { "10", "20", "30", "40", "50", "60", "70", "80", "90", "100" };

            //1. 获取数组 前3个元素
            var query1 = myarr[0..3];

            var query2 = myarr.Take(3).ToList();

            Console.WriteLine($"query1={string.Join(",", query1)}");
            Console.WriteLine($"query2={string.Join(",", query2)}");
        }

2. 提取 arr 最后三个元素

这个怎么提取呢?在 python 中直接用 -3 表示就可以了,在C# 中需要用 ^ 来表示从末尾开始,代码如下:


        static void Main(string[] args)
        {
            var myarr = new string[] { "10", "20", "30", "40", "50", "60", "70", "80", "90", "100" };

            //1. 获取数组 最后3个元素
            var query1 = myarr[^3..];

            var query2 = myarr.Skip(myarr.Length - 3).ToList();

            Console.WriteLine($"query1={string.Join(",", query1)}");
            Console.WriteLine($"query2={string.Join(",", query2)}");
        }

3. 提取 array 中index = 4,5,6 的三个位置元素

用 linq 的话,就需要使用 Skip + Take 双组合,如果用切片操作的话就太简单了。。。


        static void Main(string[] args)
        {
            var myarr = new string[] { "10", "20", "30", "40", "50", "60", "70", "80", "90", "100" };

            //1. 获取数组 中 index=4,5,6 三个位置的元素
            var query1 = myarr[4..7];

            var query2 = myarr.Skip(4).Take(3).ToList();

            Console.WriteLine($"query1={string.Join(",", query1)}");
            Console.WriteLine($"query2={string.Join(",", query2)}");
        }

从上面的切割区间 [4..7] 的输出结果来看,这是一个 左闭右开 的区间,所以要特别注意一下。

4. 获取 array 中倒数第三和第二个元素

从要求上来看就是获取元素 80 和 90,如果你理解了前面的两个用法,我相信这个你会很快的写出来,代码如下:


        static void Main(string[] args)
        {
            var myarr = new string[] { "10", "20", "30", "40", "50", "60", "70", "80", "90", "100" };

            //1. 获取 array 中倒数第三和第二个元素
            var query1 = myarr[^3..^1];

            var query2 = myarr.Skip(myarr.Length - 3).Take(2).ToList();

            Console.WriteLine($"query1={string.Join(",", query1)}");
            Console.WriteLine($"query2={string.Join(",", query2)}");
        }

三. 探究原理

通过前面 4 个例子,我想大家都知道怎么玩了,接下来就是看看到底内部是用什么做支撑的,这里使用 DnSpy 去挖挖看。

1. 从 myarr[0..3] 看起

用 dnspy 反编译代码如下:

    
    //编译前
    var query1 = myarr[0..3];

    //编译后:
	string[] query = RuntimeHelpers.GetSubArray<string>(myarr, new Range(0, 3));

从编译后的代码可以看出,原来获取切片的 array 是调用 RuntimeHelpers.GetSubArray 得到了,然后我简化一下这个方法,代码如下:


        public static T[] GetSubArray<[Nullable(2)] T>(T[] array, Range range)
        {
            ValueTuple<int, int> offsetAndLength = range.GetOffsetAndLength(array.Length);
            int item = offsetAndLength.Item1;
            int item2 = offsetAndLength.Item2;
            T[] array3 = new T[item2];
            Buffer.Memmove<T>(Unsafe.As<byte, T>(array3.GetRawSzArrayData()), Unsafe.Add<T>(Unsafe.As<byte, T>(array.GetRawSzArrayData()), item), (ulong)item2);
            return array3;
        }

从上面代码可以看到,最后的 子array 是由 Buffer.Memmove 完成的,但是给 子array 的切割位置是由 GetOffsetAndLength 方法实现,继续追一下代码:


	public readonly struct Range : IEquatable<Range>
    {   
        public Index Start { get; }
        public Index End { get; }

		public Range(Index start, Index end)
		{
			this.Start = start;
			this.End = end;
		}

        public ValueTuple<int, int> GetOffsetAndLength(int length)
        {
            Index start = this.Start;
            int num;
            if (start.IsFromEnd)
            {
                num = length - start.Value;
            }
            else
            {
                num = start.Value;
            }
            Index end = this.End;
            int num2;
            if (end.IsFromEnd)
            {
                num2 = length - end.Value;
            }
            else
            {
                num2 = end.Value;
            }
            return new ValueTuple<int, int>(num, num2 - num);
        }
    }

看完上面的代码,你可能有两点疑惑:

1) start.IsFromEnd 和 end.IsFromEnd 是什么意思。

其实看完上面代码逻辑,你就明白了,IsFromEnd 表示起始点是从左开始还是从右边开始,就这么简单。

2) 我并没有看到 start.IsFromEnd 和 end.IsFromEnd 是怎么赋上值的。

在 Index 类的构造函数中,取决于上一层怎么去 new Index 的时候塞入的 true 或者 false,如下代码:

这个例子的流程大概是: new Range(1,3) -> operator Index(int value) -> FromStart(value) -> new Index(value) ,可以看到最后在 new 的时候并没有对可选参数赋值。

2. 探究 myarr[^3..]

刚才的例子是没有对可选参数赋值,那看看本例是不是 new Index 的时候赋值了?


//编译前:
var query1 = myarr[^3..];

//编译后:
string[] query = RuntimeHelpers.GetSubArray<string>(myarr, Range.StartAt(new Index(3, true)));

看到没有,这一次 new Index 的时候,给了 IsFromEnd = true , 表示从末尾开始计算,大家再结合刚才的 GetOffsetAndLength 方法,我想这逻辑你应该理顺了吧。

四:总结

总的来说这个切片操作太实用了,作用于 arr 可以大幅度减少对 skip & take 的使用,作用于 string 也可以大幅减少 SubString 的使用,如:"12345"[1..3] -> "12345".Substring(1, 2),嘿嘿,厉害了吧! 还是C# 大法🐂👃

更多高质量干货:参见我的 GitHub: dotnetfly