AInstEmitSimdArithmetic.cs 38 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790791792793794795796797798799800801802803804805806807808809810811812813814815816817818819820821822823824825826827828829830831832833834835836837838839840841842843844845846847848849850851852853854855856857858859860861862863864865866867868869870871872873874875876877878879880881882883884885886887888889890891892893894895896897898899900901902903904905906907908909910911912913914915916917918919920921922923924925926927928929930931932933934935936937938939940941942943944945946947948949950951952953954955956957958959960961962963964965966967968969970971972973974975976977978979980981982983984985986987988989990991992993994995996997998999100010011002100310041005100610071008100910101011101210131014101510161017101810191020102110221023102410251026102710281029103010311032103310341035103610371038103910401041104210431044104510461047104810491050105110521053105410551056105710581059106010611062106310641065106610671068106910701071107210731074107510761077107810791080108110821083108410851086108710881089109010911092109310941095109610971098109911001101110211031104110511061107110811091110111111121113111411151116111711181119112011211122112311241125112611271128112911301131113211331134113511361137113811391140114111421143114411451146114711481149115011511152115311541155115611571158115911601161116211631164116511661167116811691170117111721173117411751176117711781179118011811182118311841185118611871188118911901191119211931194119511961197119811991200120112021203120412051206120712081209121012111212121312141215121612171218121912201221122212231224122512261227122812291230123112321233123412351236123712381239124012411242124312441245124612471248124912501251125212531254125512561257125812591260126112621263126412651266126712681269127012711272127312741275127612771278127912801281128212831284128512861287128812891290129112921293129412951296129712981299130013011302130313041305130613071308130913101311131213131314131513161317131813191320132113221323132413251326
  1. using ChocolArm64.Decoder;
  2. using ChocolArm64.State;
  3. using ChocolArm64.Translation;
  4. using System;
  5. using System.Reflection;
  6. using System.Reflection.Emit;
  7. using System.Runtime.Intrinsics.X86;
  8. using static ChocolArm64.Instruction.AInstEmitSimdHelper;
  9. namespace ChocolArm64.Instruction
  10. {
  11. static partial class AInstEmit
  12. {
  13. public static void Abs_S(AILEmitterCtx Context)
  14. {
  15. EmitScalarUnaryOpSx(Context, () => EmitAbs(Context));
  16. }
  17. public static void Abs_V(AILEmitterCtx Context)
  18. {
  19. EmitVectorUnaryOpSx(Context, () => EmitAbs(Context));
  20. }
  21. public static void Add_S(AILEmitterCtx Context)
  22. {
  23. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  24. }
  25. public static void Add_V(AILEmitterCtx Context)
  26. {
  27. if (AOptimizations.UseSse2)
  28. {
  29. EmitSse2Call(Context, nameof(Sse2.Add));
  30. }
  31. else
  32. {
  33. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  34. }
  35. }
  36. public static void Addhn_V(AILEmitterCtx Context)
  37. {
  38. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: false);
  39. }
  40. public static void Addp_S(AILEmitterCtx Context)
  41. {
  42. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  43. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  44. EmitVectorExtractZx(Context, Op.Rn, 1, Op.Size);
  45. Context.Emit(OpCodes.Add);
  46. EmitScalarSet(Context, Op.Rd, Op.Size);
  47. }
  48. public static void Addp_V(AILEmitterCtx Context)
  49. {
  50. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  51. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  52. int Elems = Bytes >> Op.Size;
  53. int Half = Elems >> 1;
  54. for (int Index = 0; Index < Elems; Index++)
  55. {
  56. int Elem = (Index & (Half - 1)) << 1;
  57. EmitVectorExtractZx(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, Op.Size);
  58. EmitVectorExtractZx(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, Op.Size);
  59. Context.Emit(OpCodes.Add);
  60. EmitVectorInsertTmp(Context, Index, Op.Size);
  61. }
  62. Context.EmitLdvectmp();
  63. Context.EmitStvec(Op.Rd);
  64. if (Op.RegisterSize == ARegisterSize.SIMD64)
  65. {
  66. EmitVectorZeroUpper(Context, Op.Rd);
  67. }
  68. }
  69. public static void Addv_V(AILEmitterCtx Context)
  70. {
  71. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  72. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  73. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  74. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  75. {
  76. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  77. Context.Emit(OpCodes.Add);
  78. }
  79. EmitScalarSet(Context, Op.Rd, Op.Size);
  80. }
  81. public static void Cls_V(AILEmitterCtx Context)
  82. {
  83. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingSigns));
  84. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  85. }
  86. public static void Clz_V(AILEmitterCtx Context)
  87. {
  88. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingZeros));
  89. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  90. }
  91. private static void EmitCountLeadingBits(AILEmitterCtx Context, Action Emit)
  92. {
  93. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  94. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  95. for (int Index = 0; Index < (Bytes >> Op.Size); Index++)
  96. {
  97. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  98. Context.EmitLdc_I4(8 << Op.Size);
  99. Emit();
  100. EmitVectorInsert(Context, Op.Rd, Index, Op.Size);
  101. }
  102. if (Op.RegisterSize == ARegisterSize.SIMD64)
  103. {
  104. EmitVectorZeroUpper(Context, Op.Rd);
  105. }
  106. }
  107. public static void Cnt_V(AILEmitterCtx Context)
  108. {
  109. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  110. int Elems = Op.RegisterSize == ARegisterSize.SIMD128 ? 16 : 8;
  111. for (int Index = 0; Index < Elems; Index++)
  112. {
  113. EmitVectorExtractZx(Context, Op.Rn, Index, 0);
  114. Context.Emit(OpCodes.Conv_U1);
  115. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.CountSetBits8));
  116. Context.Emit(OpCodes.Conv_U8);
  117. EmitVectorInsert(Context, Op.Rd, Index, 0);
  118. }
  119. if (Op.RegisterSize == ARegisterSize.SIMD64)
  120. {
  121. EmitVectorZeroUpper(Context, Op.Rd);
  122. }
  123. }
  124. private static void EmitAbs(AILEmitterCtx Context)
  125. {
  126. AILLabel LblTrue = new AILLabel();
  127. Context.Emit(OpCodes.Dup);
  128. Context.Emit(OpCodes.Ldc_I4_0);
  129. Context.Emit(OpCodes.Bge_S, LblTrue);
  130. Context.Emit(OpCodes.Neg);
  131. Context.MarkLabel(LblTrue);
  132. }
  133. private static void EmitHighNarrow(AILEmitterCtx Context, Action Emit, bool Round)
  134. {
  135. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  136. int Elems = 8 >> Op.Size;
  137. int ESize = 8 << Op.Size;
  138. int Part = Op.RegisterSize == ARegisterSize.SIMD128 ? Elems : 0;
  139. long RoundConst = 1L << (ESize - 1);
  140. for (int Index = 0; Index < Elems; Index++)
  141. {
  142. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size + 1);
  143. EmitVectorExtractZx(Context, Op.Rm, Index, Op.Size + 1);
  144. Emit();
  145. if (Round)
  146. {
  147. Context.EmitLdc_I8(RoundConst);
  148. Context.Emit(OpCodes.Add);
  149. }
  150. Context.EmitLsr(ESize);
  151. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  152. }
  153. if (Part == 0)
  154. {
  155. EmitVectorZeroUpper(Context, Op.Rd);
  156. }
  157. }
  158. private static void EmitSaturatingExtNarrow(AILEmitterCtx Context, bool SignedSrc, bool SignedDst, bool Scalar)
  159. {
  160. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  161. int Elems = (!Scalar ? 8 >> Op.Size : 1);
  162. int ESize = 8 << Op.Size;
  163. int Part = (!Scalar & (Op.RegisterSize == ARegisterSize.SIMD128) ? Elems : 0);
  164. int TMaxValue = (SignedDst ? (1 << (ESize - 1)) - 1 : (int)((1L << ESize) - 1L));
  165. int TMinValue = (SignedDst ? -((1 << (ESize - 1))) : 0);
  166. Context.EmitLdc_I8(0L);
  167. Context.EmitSttmp();
  168. for (int Index = 0; Index < Elems; Index++)
  169. {
  170. AILLabel LblLe = new AILLabel();
  171. AILLabel LblGeEnd = new AILLabel();
  172. EmitVectorExtract(Context, Op.Rn, Index, Op.Size + 1, SignedSrc);
  173. Context.Emit(OpCodes.Dup);
  174. Context.EmitLdc_I4(TMaxValue);
  175. Context.Emit(OpCodes.Conv_U8);
  176. Context.Emit(SignedSrc ? OpCodes.Ble_S : OpCodes.Ble_Un_S, LblLe);
  177. Context.Emit(OpCodes.Pop);
  178. Context.EmitLdc_I4(TMaxValue);
  179. Context.EmitLdc_I8(0x8000000L);
  180. Context.EmitSttmp();
  181. Context.Emit(OpCodes.Br_S, LblGeEnd);
  182. Context.MarkLabel(LblLe);
  183. Context.Emit(OpCodes.Dup);
  184. Context.EmitLdc_I4(TMinValue);
  185. Context.Emit(OpCodes.Conv_I8);
  186. Context.Emit(SignedSrc ? OpCodes.Bge_S : OpCodes.Bge_Un_S, LblGeEnd);
  187. Context.Emit(OpCodes.Pop);
  188. Context.EmitLdc_I4(TMinValue);
  189. Context.EmitLdc_I8(0x8000000L);
  190. Context.EmitSttmp();
  191. Context.MarkLabel(LblGeEnd);
  192. if (Scalar)
  193. {
  194. EmitVectorZeroLower(Context, Op.Rd);
  195. }
  196. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  197. }
  198. if (Part == 0)
  199. {
  200. EmitVectorZeroUpper(Context, Op.Rd);
  201. }
  202. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  203. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  204. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  205. Context.EmitLdtmp();
  206. Context.Emit(OpCodes.Conv_I4);
  207. Context.Emit(OpCodes.Or);
  208. Context.EmitCallPropSet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  209. }
  210. public static void Fabd_S(AILEmitterCtx Context)
  211. {
  212. EmitScalarBinaryOpF(Context, () =>
  213. {
  214. Context.Emit(OpCodes.Sub);
  215. EmitUnaryMathCall(Context, nameof(Math.Abs));
  216. });
  217. }
  218. public static void Fabs_S(AILEmitterCtx Context)
  219. {
  220. EmitScalarUnaryOpF(Context, () =>
  221. {
  222. EmitUnaryMathCall(Context, nameof(Math.Abs));
  223. });
  224. }
  225. public static void Fabs_V(AILEmitterCtx Context)
  226. {
  227. EmitVectorUnaryOpF(Context, () =>
  228. {
  229. EmitUnaryMathCall(Context, nameof(Math.Abs));
  230. });
  231. }
  232. public static void Fadd_S(AILEmitterCtx Context)
  233. {
  234. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  235. {
  236. EmitSseOrSse2CallF(Context, nameof(Sse.AddScalar));
  237. }
  238. else
  239. {
  240. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  241. }
  242. }
  243. public static void Fadd_V(AILEmitterCtx Context)
  244. {
  245. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  246. {
  247. EmitSseOrSse2CallF(Context, nameof(Sse.Add));
  248. }
  249. else
  250. {
  251. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  252. }
  253. }
  254. public static void Faddp_S(AILEmitterCtx Context)
  255. {
  256. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  257. int SizeF = Op.Size & 1;
  258. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  259. EmitVectorExtractF(Context, Op.Rn, 1, SizeF);
  260. Context.Emit(OpCodes.Add);
  261. EmitScalarSetF(Context, Op.Rd, SizeF);
  262. }
  263. public static void Faddp_V(AILEmitterCtx Context)
  264. {
  265. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  266. int SizeF = Op.Size & 1;
  267. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  268. int Elems = Bytes >> SizeF + 2;
  269. int Half = Elems >> 1;
  270. for (int Index = 0; Index < Elems; Index++)
  271. {
  272. int Elem = (Index & (Half - 1)) << 1;
  273. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, SizeF);
  274. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, SizeF);
  275. Context.Emit(OpCodes.Add);
  276. EmitVectorInsertTmpF(Context, Index, SizeF);
  277. }
  278. Context.EmitLdvectmp();
  279. Context.EmitStvec(Op.Rd);
  280. if (Op.RegisterSize == ARegisterSize.SIMD64)
  281. {
  282. EmitVectorZeroUpper(Context, Op.Rd);
  283. }
  284. }
  285. public static void Fdiv_S(AILEmitterCtx Context)
  286. {
  287. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  288. {
  289. EmitSseOrSse2CallF(Context, nameof(Sse.DivideScalar));
  290. }
  291. else
  292. {
  293. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  294. }
  295. }
  296. public static void Fdiv_V(AILEmitterCtx Context)
  297. {
  298. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  299. {
  300. EmitSseOrSse2CallF(Context, nameof(Sse.Divide));
  301. }
  302. else
  303. {
  304. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  305. }
  306. }
  307. public static void Fmadd_S(AILEmitterCtx Context)
  308. {
  309. EmitScalarTernaryRaOpF(Context, () =>
  310. {
  311. Context.Emit(OpCodes.Mul);
  312. Context.Emit(OpCodes.Add);
  313. });
  314. }
  315. public static void Fmax_S(AILEmitterCtx Context)
  316. {
  317. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  318. EmitScalarBinaryOpF(Context, () =>
  319. {
  320. if (Op.Size == 0)
  321. {
  322. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  323. }
  324. else if (Op.Size == 1)
  325. {
  326. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  327. }
  328. else
  329. {
  330. throw new InvalidOperationException();
  331. }
  332. });
  333. }
  334. public static void Fmax_V(AILEmitterCtx Context)
  335. {
  336. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  337. EmitVectorBinaryOpF(Context, () =>
  338. {
  339. if (Op.Size == 0)
  340. {
  341. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  342. }
  343. else if (Op.Size == 1)
  344. {
  345. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  346. }
  347. else
  348. {
  349. throw new InvalidOperationException();
  350. }
  351. });
  352. }
  353. public static void Fmin_S(AILEmitterCtx Context)
  354. {
  355. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  356. EmitScalarBinaryOpF(Context, () =>
  357. {
  358. if (Op.Size == 0)
  359. {
  360. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  361. }
  362. else if (Op.Size == 1)
  363. {
  364. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  365. }
  366. else
  367. {
  368. throw new InvalidOperationException();
  369. }
  370. });
  371. }
  372. public static void Fmin_V(AILEmitterCtx Context)
  373. {
  374. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  375. int SizeF = Op.Size & 1;
  376. EmitVectorBinaryOpF(Context, () =>
  377. {
  378. if (SizeF == 0)
  379. {
  380. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  381. }
  382. else if (SizeF == 1)
  383. {
  384. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  385. }
  386. else
  387. {
  388. throw new InvalidOperationException();
  389. }
  390. });
  391. }
  392. public static void Fmaxnm_S(AILEmitterCtx Context)
  393. {
  394. Fmax_S(Context);
  395. }
  396. public static void Fminnm_S(AILEmitterCtx Context)
  397. {
  398. Fmin_S(Context);
  399. }
  400. public static void Fmla_Se(AILEmitterCtx Context)
  401. {
  402. EmitScalarTernaryOpByElemF(Context, () =>
  403. {
  404. Context.Emit(OpCodes.Mul);
  405. Context.Emit(OpCodes.Add);
  406. });
  407. }
  408. public static void Fmla_V(AILEmitterCtx Context)
  409. {
  410. EmitVectorTernaryOpF(Context, () =>
  411. {
  412. Context.Emit(OpCodes.Mul);
  413. Context.Emit(OpCodes.Add);
  414. });
  415. }
  416. public static void Fmla_Ve(AILEmitterCtx Context)
  417. {
  418. EmitVectorTernaryOpByElemF(Context, () =>
  419. {
  420. Context.Emit(OpCodes.Mul);
  421. Context.Emit(OpCodes.Add);
  422. });
  423. }
  424. public static void Fmls_V(AILEmitterCtx Context)
  425. {
  426. EmitVectorTernaryOpF(Context, () =>
  427. {
  428. Context.Emit(OpCodes.Mul);
  429. Context.Emit(OpCodes.Sub);
  430. });
  431. }
  432. public static void Fmls_Ve(AILEmitterCtx Context)
  433. {
  434. EmitVectorTernaryOpByElemF(Context, () =>
  435. {
  436. Context.Emit(OpCodes.Mul);
  437. Context.Emit(OpCodes.Sub);
  438. });
  439. }
  440. public static void Fmsub_S(AILEmitterCtx Context)
  441. {
  442. EmitScalarTernaryRaOpF(Context, () =>
  443. {
  444. Context.Emit(OpCodes.Mul);
  445. Context.Emit(OpCodes.Sub);
  446. });
  447. }
  448. public static void Fmul_S(AILEmitterCtx Context)
  449. {
  450. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  451. {
  452. EmitSseOrSse2CallF(Context, nameof(Sse.MultiplyScalar));
  453. }
  454. else
  455. {
  456. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  457. }
  458. }
  459. public static void Fmul_Se(AILEmitterCtx Context)
  460. {
  461. EmitScalarBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  462. }
  463. public static void Fmul_V(AILEmitterCtx Context)
  464. {
  465. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  466. {
  467. EmitSseOrSse2CallF(Context, nameof(Sse.Multiply));
  468. }
  469. else
  470. {
  471. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  472. }
  473. }
  474. public static void Fmul_Ve(AILEmitterCtx Context)
  475. {
  476. EmitVectorBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  477. }
  478. public static void Fneg_S(AILEmitterCtx Context)
  479. {
  480. EmitScalarUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  481. }
  482. public static void Fneg_V(AILEmitterCtx Context)
  483. {
  484. EmitVectorUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  485. }
  486. public static void Fnmadd_S(AILEmitterCtx Context)
  487. {
  488. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  489. int SizeF = Op.Size & 1;
  490. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  491. Context.Emit(OpCodes.Neg);
  492. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  493. Context.Emit(OpCodes.Mul);
  494. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  495. Context.Emit(OpCodes.Sub);
  496. EmitScalarSetF(Context, Op.Rd, SizeF);
  497. }
  498. public static void Fnmsub_S(AILEmitterCtx Context)
  499. {
  500. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  501. int SizeF = Op.Size & 1;
  502. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  503. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  504. Context.Emit(OpCodes.Mul);
  505. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  506. Context.Emit(OpCodes.Sub);
  507. EmitScalarSetF(Context, Op.Rd, SizeF);
  508. }
  509. public static void Fnmul_S(AILEmitterCtx Context)
  510. {
  511. EmitScalarBinaryOpF(Context, () =>
  512. {
  513. Context.Emit(OpCodes.Mul);
  514. Context.Emit(OpCodes.Neg);
  515. });
  516. }
  517. public static void Frecpe_S(AILEmitterCtx Context)
  518. {
  519. EmitFrecpe(Context, 0, Scalar: true);
  520. }
  521. public static void Frecpe_V(AILEmitterCtx Context)
  522. {
  523. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  524. int SizeF = Op.Size & 1;
  525. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  526. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  527. {
  528. EmitFrecpe(Context, Index, Scalar: false);
  529. }
  530. if (Op.RegisterSize == ARegisterSize.SIMD64)
  531. {
  532. EmitVectorZeroUpper(Context, Op.Rd);
  533. }
  534. }
  535. private static void EmitFrecpe(AILEmitterCtx Context, int Index, bool Scalar)
  536. {
  537. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  538. int SizeF = Op.Size & 1;
  539. if (SizeF == 0)
  540. {
  541. Context.EmitLdc_R4(1);
  542. }
  543. else /* if (SizeF == 1) */
  544. {
  545. Context.EmitLdc_R8(1);
  546. }
  547. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  548. Context.Emit(OpCodes.Div);
  549. if (Scalar)
  550. {
  551. EmitVectorZeroAll(Context, Op.Rd);
  552. }
  553. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  554. }
  555. public static void Frecps_S(AILEmitterCtx Context)
  556. {
  557. EmitFrecps(Context, 0, Scalar: true);
  558. }
  559. public static void Frecps_V(AILEmitterCtx Context)
  560. {
  561. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  562. int SizeF = Op.Size & 1;
  563. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  564. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  565. {
  566. EmitFrecps(Context, Index, Scalar: false);
  567. }
  568. if (Op.RegisterSize == ARegisterSize.SIMD64)
  569. {
  570. EmitVectorZeroUpper(Context, Op.Rd);
  571. }
  572. }
  573. private static void EmitFrecps(AILEmitterCtx Context, int Index, bool Scalar)
  574. {
  575. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  576. int SizeF = Op.Size & 1;
  577. if (SizeF == 0)
  578. {
  579. Context.EmitLdc_R4(2);
  580. }
  581. else /* if (SizeF == 1) */
  582. {
  583. Context.EmitLdc_R8(2);
  584. }
  585. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  586. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  587. Context.Emit(OpCodes.Mul);
  588. Context.Emit(OpCodes.Sub);
  589. if (Scalar)
  590. {
  591. EmitVectorZeroAll(Context, Op.Rd);
  592. }
  593. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  594. }
  595. public static void Frinta_S(AILEmitterCtx Context)
  596. {
  597. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  598. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  599. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  600. EmitScalarSetF(Context, Op.Rd, Op.Size);
  601. }
  602. public static void Frinta_V(AILEmitterCtx Context)
  603. {
  604. EmitVectorUnaryOpF(Context, () =>
  605. {
  606. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  607. });
  608. }
  609. public static void Frinti_S(AILEmitterCtx Context)
  610. {
  611. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  612. EmitScalarUnaryOpF(Context, () =>
  613. {
  614. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  615. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  616. if (Op.Size == 0)
  617. {
  618. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  619. }
  620. else if (Op.Size == 1)
  621. {
  622. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  623. }
  624. else
  625. {
  626. throw new InvalidOperationException();
  627. }
  628. });
  629. }
  630. public static void Frinti_V(AILEmitterCtx Context)
  631. {
  632. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  633. int SizeF = Op.Size & 1;
  634. EmitVectorUnaryOpF(Context, () =>
  635. {
  636. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  637. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  638. if (SizeF == 0)
  639. {
  640. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  641. }
  642. else if (SizeF == 1)
  643. {
  644. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  645. }
  646. else
  647. {
  648. throw new InvalidOperationException();
  649. }
  650. });
  651. }
  652. public static void Frintm_S(AILEmitterCtx Context)
  653. {
  654. EmitScalarUnaryOpF(Context, () =>
  655. {
  656. EmitUnaryMathCall(Context, nameof(Math.Floor));
  657. });
  658. }
  659. public static void Frintm_V(AILEmitterCtx Context)
  660. {
  661. EmitVectorUnaryOpF(Context, () =>
  662. {
  663. EmitUnaryMathCall(Context, nameof(Math.Floor));
  664. });
  665. }
  666. public static void Frintn_S(AILEmitterCtx Context)
  667. {
  668. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  669. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  670. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  671. EmitScalarSetF(Context, Op.Rd, Op.Size);
  672. }
  673. public static void Frintn_V(AILEmitterCtx Context)
  674. {
  675. EmitVectorUnaryOpF(Context, () =>
  676. {
  677. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  678. });
  679. }
  680. public static void Frintp_S(AILEmitterCtx Context)
  681. {
  682. EmitScalarUnaryOpF(Context, () =>
  683. {
  684. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  685. });
  686. }
  687. public static void Frintp_V(AILEmitterCtx Context)
  688. {
  689. EmitVectorUnaryOpF(Context, () =>
  690. {
  691. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  692. });
  693. }
  694. public static void Frintx_S(AILEmitterCtx Context)
  695. {
  696. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  697. EmitScalarUnaryOpF(Context, () =>
  698. {
  699. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  700. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  701. if (Op.Size == 0)
  702. {
  703. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  704. }
  705. else if (Op.Size == 1)
  706. {
  707. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  708. }
  709. else
  710. {
  711. throw new InvalidOperationException();
  712. }
  713. });
  714. }
  715. public static void Frintx_V(AILEmitterCtx Context)
  716. {
  717. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  718. EmitVectorUnaryOpF(Context, () =>
  719. {
  720. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  721. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  722. if (Op.Size == 0)
  723. {
  724. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  725. }
  726. else if (Op.Size == 1)
  727. {
  728. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  729. }
  730. else
  731. {
  732. throw new InvalidOperationException();
  733. }
  734. });
  735. }
  736. public static void Frsqrte_S(AILEmitterCtx Context)
  737. {
  738. EmitScalarUnaryOpF(Context, () =>
  739. {
  740. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  741. });
  742. }
  743. public static void Frsqrte_V(AILEmitterCtx Context)
  744. {
  745. EmitVectorUnaryOpF(Context, () =>
  746. {
  747. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  748. });
  749. }
  750. public static void Frsqrts_S(AILEmitterCtx Context)
  751. {
  752. EmitFrsqrts(Context, 0, Scalar: true);
  753. }
  754. public static void Frsqrts_V(AILEmitterCtx Context)
  755. {
  756. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  757. int SizeF = Op.Size & 1;
  758. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  759. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  760. {
  761. EmitFrsqrts(Context, Index, Scalar: false);
  762. }
  763. if (Op.RegisterSize == ARegisterSize.SIMD64)
  764. {
  765. EmitVectorZeroUpper(Context, Op.Rd);
  766. }
  767. }
  768. private static void EmitFrsqrts(AILEmitterCtx Context, int Index, bool Scalar)
  769. {
  770. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  771. int SizeF = Op.Size & 1;
  772. if (SizeF == 0)
  773. {
  774. Context.EmitLdc_R4(3);
  775. }
  776. else /* if (SizeF == 1) */
  777. {
  778. Context.EmitLdc_R8(3);
  779. }
  780. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  781. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  782. Context.Emit(OpCodes.Mul);
  783. Context.Emit(OpCodes.Sub);
  784. if (SizeF == 0)
  785. {
  786. Context.EmitLdc_R4(0.5f);
  787. }
  788. else /* if (SizeF == 1) */
  789. {
  790. Context.EmitLdc_R8(0.5);
  791. }
  792. Context.Emit(OpCodes.Mul);
  793. if (Scalar)
  794. {
  795. EmitVectorZeroAll(Context, Op.Rd);
  796. }
  797. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  798. }
  799. public static void Fsqrt_S(AILEmitterCtx Context)
  800. {
  801. EmitScalarUnaryOpF(Context, () =>
  802. {
  803. EmitUnaryMathCall(Context, nameof(Math.Sqrt));
  804. });
  805. }
  806. public static void Fsub_S(AILEmitterCtx Context)
  807. {
  808. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  809. {
  810. EmitSseOrSse2CallF(Context, nameof(Sse.SubtractScalar));
  811. }
  812. else
  813. {
  814. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  815. }
  816. }
  817. public static void Fsub_V(AILEmitterCtx Context)
  818. {
  819. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  820. {
  821. EmitSseOrSse2CallF(Context, nameof(Sse.Subtract));
  822. }
  823. else
  824. {
  825. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  826. }
  827. }
  828. public static void Mla_V(AILEmitterCtx Context)
  829. {
  830. EmitVectorTernaryOpZx(Context, () =>
  831. {
  832. Context.Emit(OpCodes.Mul);
  833. Context.Emit(OpCodes.Add);
  834. });
  835. }
  836. public static void Mla_Ve(AILEmitterCtx Context)
  837. {
  838. EmitVectorTernaryOpByElemZx(Context, () =>
  839. {
  840. Context.Emit(OpCodes.Mul);
  841. Context.Emit(OpCodes.Add);
  842. });
  843. }
  844. public static void Mls_V(AILEmitterCtx Context)
  845. {
  846. EmitVectorTernaryOpZx(Context, () =>
  847. {
  848. Context.Emit(OpCodes.Mul);
  849. Context.Emit(OpCodes.Sub);
  850. });
  851. }
  852. public static void Mul_V(AILEmitterCtx Context)
  853. {
  854. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  855. }
  856. public static void Mul_Ve(AILEmitterCtx Context)
  857. {
  858. EmitVectorBinaryOpByElemZx(Context, () => Context.Emit(OpCodes.Mul));
  859. }
  860. public static void Neg_S(AILEmitterCtx Context)
  861. {
  862. EmitScalarUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  863. }
  864. public static void Neg_V(AILEmitterCtx Context)
  865. {
  866. EmitVectorUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  867. }
  868. public static void Raddhn_V(AILEmitterCtx Context)
  869. {
  870. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: true);
  871. }
  872. public static void Rsubhn_V(AILEmitterCtx Context)
  873. {
  874. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: true);
  875. }
  876. public static void Saba_V(AILEmitterCtx Context)
  877. {
  878. EmitVectorTernaryOpSx(Context, () =>
  879. {
  880. Context.Emit(OpCodes.Sub);
  881. EmitAbs(Context);
  882. Context.Emit(OpCodes.Add);
  883. });
  884. }
  885. public static void Sabal_V(AILEmitterCtx Context)
  886. {
  887. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  888. {
  889. Context.Emit(OpCodes.Sub);
  890. EmitAbs(Context);
  891. Context.Emit(OpCodes.Add);
  892. });
  893. }
  894. public static void Sabd_V(AILEmitterCtx Context)
  895. {
  896. EmitVectorBinaryOpSx(Context, () =>
  897. {
  898. Context.Emit(OpCodes.Sub);
  899. EmitAbs(Context);
  900. });
  901. }
  902. public static void Sabdl_V(AILEmitterCtx Context)
  903. {
  904. EmitVectorWidenRnRmBinaryOpSx(Context, () =>
  905. {
  906. Context.Emit(OpCodes.Sub);
  907. EmitAbs(Context);
  908. });
  909. }
  910. public static void Saddw_V(AILEmitterCtx Context)
  911. {
  912. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
  913. }
  914. public static void Smax_V(AILEmitterCtx Context)
  915. {
  916. Type[] Types = new Type[] { typeof(long), typeof(long) };
  917. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  918. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  919. }
  920. public static void Smin_V(AILEmitterCtx Context)
  921. {
  922. Type[] Types = new Type[] { typeof(long), typeof(long) };
  923. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  924. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  925. }
  926. public static void Smlal_V(AILEmitterCtx Context)
  927. {
  928. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  929. {
  930. Context.Emit(OpCodes.Mul);
  931. Context.Emit(OpCodes.Add);
  932. });
  933. }
  934. public static void Smull_V(AILEmitterCtx Context)
  935. {
  936. EmitVectorWidenRnRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Mul));
  937. }
  938. public static void Sqxtn_S(AILEmitterCtx Context)
  939. {
  940. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: true, Scalar: true);
  941. }
  942. public static void Sqxtn_V(AILEmitterCtx Context)
  943. {
  944. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: true, Scalar: false);
  945. }
  946. public static void Sqxtun_S(AILEmitterCtx Context)
  947. {
  948. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: false, Scalar: true);
  949. }
  950. public static void Sqxtun_V(AILEmitterCtx Context)
  951. {
  952. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: false, Scalar: false);
  953. }
  954. public static void Sub_S(AILEmitterCtx Context)
  955. {
  956. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  957. }
  958. public static void Sub_V(AILEmitterCtx Context)
  959. {
  960. if (AOptimizations.UseSse2)
  961. {
  962. EmitSse2Call(Context, nameof(Sse2.Subtract));
  963. }
  964. else
  965. {
  966. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  967. }
  968. }
  969. public static void Subhn_V(AILEmitterCtx Context)
  970. {
  971. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: false);
  972. }
  973. public static void Uaba_V(AILEmitterCtx Context)
  974. {
  975. EmitVectorTernaryOpZx(Context, () =>
  976. {
  977. Context.Emit(OpCodes.Sub);
  978. EmitAbs(Context);
  979. Context.Emit(OpCodes.Add);
  980. });
  981. }
  982. public static void Uabal_V(AILEmitterCtx Context)
  983. {
  984. EmitVectorWidenRnRmTernaryOpZx(Context, () =>
  985. {
  986. Context.Emit(OpCodes.Sub);
  987. EmitAbs(Context);
  988. Context.Emit(OpCodes.Add);
  989. });
  990. }
  991. public static void Uabd_V(AILEmitterCtx Context)
  992. {
  993. EmitVectorBinaryOpZx(Context, () =>
  994. {
  995. Context.Emit(OpCodes.Sub);
  996. EmitAbs(Context);
  997. });
  998. }
  999. public static void Uabdl_V(AILEmitterCtx Context)
  1000. {
  1001. EmitVectorWidenRnRmBinaryOpZx(Context, () =>
  1002. {
  1003. Context.Emit(OpCodes.Sub);
  1004. EmitAbs(Context);
  1005. });
  1006. }
  1007. public static void Uaddl_V(AILEmitterCtx Context)
  1008. {
  1009. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  1010. }
  1011. public static void Uaddlv_V(AILEmitterCtx Context)
  1012. {
  1013. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  1014. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  1015. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  1016. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  1017. {
  1018. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  1019. Context.Emit(OpCodes.Add);
  1020. }
  1021. EmitScalarSet(Context, Op.Rd, Op.Size + 1);
  1022. }
  1023. public static void Uaddw_V(AILEmitterCtx Context)
  1024. {
  1025. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  1026. }
  1027. public static void Uhadd_V(AILEmitterCtx Context)
  1028. {
  1029. EmitVectorBinaryOpZx(Context, () =>
  1030. {
  1031. Context.Emit(OpCodes.Add);
  1032. Context.EmitLdc_I4(1);
  1033. Context.Emit(OpCodes.Shr_Un);
  1034. });
  1035. }
  1036. public static void Umull_V(AILEmitterCtx Context)
  1037. {
  1038. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  1039. }
  1040. public static void Uqxtn_S(AILEmitterCtx Context)
  1041. {
  1042. EmitSaturatingExtNarrow(Context, SignedSrc: false, SignedDst: false, Scalar: true);
  1043. }
  1044. public static void Uqxtn_V(AILEmitterCtx Context)
  1045. {
  1046. EmitSaturatingExtNarrow(Context, SignedSrc: false, SignedDst: false, Scalar: false);
  1047. }
  1048. }
  1049. }