透视C# Span<T>数据结构

网友投稿 347 2022-08-22

透视C# Span<T>数据结构

先谈一下我对Span的看法, Span是指向任意连续内存空间的类型安全、内存安全的视图,可操作的滑动窗口。

Span和Memory都是包装了可以在pipeline上使用的结构化数据的内存缓冲器,他们被设计用于在pipeline中高效传递数据。

定语解读

这里面许多定语,值得我们细细揣摩:

1. 指向任意连续内存空间:支持托管堆,原生内存、堆栈, 这个可从Span2. 类型安全:Span 是一个泛型。3. 内存安全: Span[1]是一个​​readonly ref struct​​数据结构,用于表征一段连续内存的关键属性被设置成只读readonly, 保证了所有的操作只能在这段内存内。

// 截取自Span源码 public readonly ref struct Span{ // 表征一段连续内存的关键属性 Pointer & Length 都只能从构造函数赋值 ///

A byref or a native ptr. internal readonly ByReference _reference; /// The number of elements this Span contains. private readonly int _length; [MethodImpl(MethodImplOptions.AggressiveInlining)] public Span(T[]? array) { if (array == null) { this = default; return; // returns default } if (!typeof(T).IsValueType && array.GetType() != typeof(T[])) ThrowHelper.ThrowArrayTypeMismatchException(); _reference = new ByReference(ref MemoryMarshal.GetArrayDataReference(array)); _length = array.Length; }}

至此我们来看一个简单的用法, 利用span操作指向一段堆栈空间。

static void Main() { Span arraySpan = stackalloc byte[100]; // 包含指针和Length的只读指针, 类似于go里面的切片 byte data = 0; for (int ctr = 0; ctr < arraySpan.Length; ctr++) arraySpan[ctr] = data++; arraySpan.Fill(1); var arraySum = Sum(arraySpan); Console.WriteLine($"The sum is {arraySum}"); // 输出100 arraySpan.Clear(); var slice = arraySpan.Slice(0,50); // 因为是只读属性, 内部New Span<>(), 产生新的切片 arraySum = Sum(slice); Console.WriteLine($"The sum is {arraySum}"); // 输出0 } [MethodImpl(MethodImplOptions.AggressiveInlining)] static int Sum(Span array) { int arraySum = 0; foreach (var value in array) arraySum += value; return arraySum; }

• 此处Span  指向了特定的堆栈空间, Fill,Clear 等操作的效果直接体现到该段内存。• 注意Slice切片方法,内部实质是产生新的Span,是一个新的视图,对新span的操作会体现到原始底层数据结构。

[MethodImpl(MethodImplOptions.AggressiveInlining)] public Span Slice(int start) { if ((uint)start > (uint)_length) ThrowHelper.ThrowArgumentOutOfRangeException(); return new Span(ref Unsafe.Add(ref _reference.Value, (nint)(uint)start /* force zero-extension */), _length - start); }

从Slice切片源码可以看到,实质是利用原ptr & length 产生包含新的ptr & length的操作视图, ptr其实是指针的移动,也就是定位新的数据块, 但是终归是在原始数据块内部。

衍生技能点

我们再细看Span的定义, 有几个关键词建议大家温故而知新。

1. readonly strcut[2]

从C#7.2开始,你可以将readonly作用在struct上,指示该struct不可改变。

span 被定义为readonly struct,内部属性自然也是readonly,从上面的分析和实例看我们可以针对Span表征的特定连续内存空间做内容更新操作; 如果想限制更新该连续内存空间的内容, C#提供了​​​ReadOnlySpan​​类型, 该类型强调该块内存只读,也就是不存在Span 拥有的Fill,Clear等方法。

一线码农大佬写了文章讲述[​​使用span对字符串求和​​]的姿势,大家都说使用span能高效操作内存,我们对该用例BenchmarkDotNet压测。

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;using System.Buffers;using System.Runtime.CompilerServices;using BenchmarkDotNet.Attributes;using BenchmarkDotNet.Running;namespace ConsoleApp3{ public class Program { static void Main() { var summary = BenchmarkRunner.Run(); } } [MemoryDiagnoser,RankColumn] public class MemoryBenchmarkerDemo { int NumberOfItems = 100000; // 对字符串切割, 会产生字符串小对象 [Benchmark] public void StringSplit() { for (int i = 0; i < NumberOfItems; i++) { var s = "97 3"; var arr = s.Split(new string[] { " " }, StringSplitOptions.RemoveEmptyEntries); var num1 = int.Parse(arr[0]); var num2 = int.Parse(arr[1]); _ = num1 + num2; } } // 对底层字符串切片 [Benchmark] public void StringSlice() { for (int i = 0; i < NumberOfItems; i++) { var s = "97 3"; var position = s.IndexOf(' '); ReadOnlySpan span = s.AsSpan(); var num1 = int.Parse(span.Slice(0, position)); var num2 = int.Parse(span.Slice(position)); _= num1+ num2; } } }}

压测解读:

对字符串运行时切分,不会利用驻留池,于是case1会分配大量小对象;对gc造成压力。

case2对底层字符串切片,虽然会产生不同的透视对象Span, 但是实际引用了的原始内存块的偏移区间, 不存在分配新内存。

2. ref struct[3]

从C#7.2开始,ref可以作用在struct,指示该类型被分配在堆栈上,并且不能转义到托管堆。

Span,ReadonlySpan 包装了对于任意连续内存快的透视操作,但是只能被存储堆栈上,不适用于一些场景,例如异步调用,.NET Core 2.1为此新增了Memory[4] , ReadOnlyMemory, 可以被存储在托管堆上,这个暂时按下不表。

最后用一张图总结, 本文成文,感谢[ yi念之间 ]大佬参与讨论。

引用链接

​​[1]​​ Span: ​​strcut: ​​struct: ​​https://docs.microsoft.com/en-us/dotnet/csharp/language-reference/builtin-types/struct​​​​​[4]​​ Memory: ​​https://docs.microsoft.com/en-us/dotnet/standard/memory-and-spans/memory-t-usage-guidelines ​​

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:英国私教学员Python答疑「Python一对一学员答疑」
下一篇:程序员深夜用Python跑神经网络,只为用两种动作就关掉了台灯
相关文章

 发表评论

暂时没有评论,来抢沙发吧~