AInstEmitSimdArithmetic.cs 39 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229123012311232123312341235123612371238123912401241124212431244124512461247124812491250125112521253125412551256125712581259126012611262126312641265126612671268126912701271127212731274127512761277127812791280128112821283128412851286128712881289129012911292129312941295129612971298129913001301130213031304130513061307130813091310131113121313131413151316131713181319132013211322132313241325132613271328132913301331133213331334133513361337133813391340134113421343134413451346134713481349135013511352135313541355
  1. using ChocolArm64.Decoder;
  2. using ChocolArm64.State;
  3. using ChocolArm64.Translation;
  4. using System;
  5. using System.Reflection;
  6. using System.Reflection.Emit;
  7. using System.Runtime.Intrinsics.X86;
  8. using static ChocolArm64.Instruction.AInstEmitSimdHelper;
  9. namespace ChocolArm64.Instruction
  10. {
  11. static partial class AInstEmit
  12. {
  13. public static void Abs_S(AILEmitterCtx Context)
  14. {
  15. EmitScalarUnaryOpSx(Context, () => EmitAbs(Context));
  16. }
  17. public static void Abs_V(AILEmitterCtx Context)
  18. {
  19. EmitVectorUnaryOpSx(Context, () => EmitAbs(Context));
  20. }
  21. public static void Add_S(AILEmitterCtx Context)
  22. {
  23. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  24. }
  25. public static void Add_V(AILEmitterCtx Context)
  26. {
  27. if (AOptimizations.UseSse2)
  28. {
  29. EmitSse2Call(Context, nameof(Sse2.Add));
  30. }
  31. else
  32. {
  33. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  34. }
  35. }
  36. public static void Addhn_V(AILEmitterCtx Context)
  37. {
  38. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: false);
  39. }
  40. public static void Addp_S(AILEmitterCtx Context)
  41. {
  42. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  43. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  44. EmitVectorExtractZx(Context, Op.Rn, 1, Op.Size);
  45. Context.Emit(OpCodes.Add);
  46. EmitScalarSet(Context, Op.Rd, Op.Size);
  47. }
  48. public static void Addp_V(AILEmitterCtx Context)
  49. {
  50. EmitVectorPairwiseOpZx(Context, () => Context.Emit(OpCodes.Add));
  51. }
  52. public static void Addv_V(AILEmitterCtx Context)
  53. {
  54. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  55. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  56. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  57. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  58. {
  59. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  60. Context.Emit(OpCodes.Add);
  61. }
  62. EmitScalarSet(Context, Op.Rd, Op.Size);
  63. }
  64. public static void Cls_V(AILEmitterCtx Context)
  65. {
  66. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingSigns));
  67. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  68. }
  69. public static void Clz_V(AILEmitterCtx Context)
  70. {
  71. MethodInfo MthdInfo = typeof(ASoftFallback).GetMethod(nameof(ASoftFallback.CountLeadingZeros));
  72. EmitCountLeadingBits(Context, () => Context.EmitCall(MthdInfo));
  73. }
  74. private static void EmitCountLeadingBits(AILEmitterCtx Context, Action Emit)
  75. {
  76. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  77. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  78. for (int Index = 0; Index < (Bytes >> Op.Size); Index++)
  79. {
  80. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  81. Context.EmitLdc_I4(8 << Op.Size);
  82. Emit();
  83. EmitVectorInsert(Context, Op.Rd, Index, Op.Size);
  84. }
  85. if (Op.RegisterSize == ARegisterSize.SIMD64)
  86. {
  87. EmitVectorZeroUpper(Context, Op.Rd);
  88. }
  89. }
  90. public static void Cnt_V(AILEmitterCtx Context)
  91. {
  92. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  93. int Elems = Op.RegisterSize == ARegisterSize.SIMD128 ? 16 : 8;
  94. for (int Index = 0; Index < Elems; Index++)
  95. {
  96. EmitVectorExtractZx(Context, Op.Rn, Index, 0);
  97. Context.Emit(OpCodes.Conv_U4);
  98. ASoftFallback.EmitCall(Context, nameof(ASoftFallback.CountSetBits8));
  99. Context.Emit(OpCodes.Conv_U8);
  100. EmitVectorInsert(Context, Op.Rd, Index, 0);
  101. }
  102. if (Op.RegisterSize == ARegisterSize.SIMD64)
  103. {
  104. EmitVectorZeroUpper(Context, Op.Rd);
  105. }
  106. }
  107. private static void EmitAbs(AILEmitterCtx Context)
  108. {
  109. AILLabel LblTrue = new AILLabel();
  110. Context.Emit(OpCodes.Dup);
  111. Context.Emit(OpCodes.Ldc_I4_0);
  112. Context.Emit(OpCodes.Bge_S, LblTrue);
  113. Context.Emit(OpCodes.Neg);
  114. Context.MarkLabel(LblTrue);
  115. }
  116. private static void EmitHighNarrow(AILEmitterCtx Context, Action Emit, bool Round)
  117. {
  118. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  119. int Elems = 8 >> Op.Size;
  120. int ESize = 8 << Op.Size;
  121. int Part = Op.RegisterSize == ARegisterSize.SIMD128 ? Elems : 0;
  122. long RoundConst = 1L << (ESize - 1);
  123. for (int Index = 0; Index < Elems; Index++)
  124. {
  125. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size + 1);
  126. EmitVectorExtractZx(Context, Op.Rm, Index, Op.Size + 1);
  127. Emit();
  128. if (Round)
  129. {
  130. Context.EmitLdc_I8(RoundConst);
  131. Context.Emit(OpCodes.Add);
  132. }
  133. Context.EmitLsr(ESize);
  134. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  135. }
  136. if (Part == 0)
  137. {
  138. EmitVectorZeroUpper(Context, Op.Rd);
  139. }
  140. }
  141. private static void EmitSaturatingExtNarrow(AILEmitterCtx Context, bool SignedSrc, bool SignedDst, bool Scalar)
  142. {
  143. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  144. int Elems = (!Scalar ? 8 >> Op.Size : 1);
  145. int ESize = 8 << Op.Size;
  146. int Part = (!Scalar & (Op.RegisterSize == ARegisterSize.SIMD128) ? Elems : 0);
  147. int TMaxValue = (SignedDst ? (1 << (ESize - 1)) - 1 : (int)((1L << ESize) - 1L));
  148. int TMinValue = (SignedDst ? -((1 << (ESize - 1))) : 0);
  149. Context.EmitLdc_I8(0L);
  150. Context.EmitSttmp();
  151. for (int Index = 0; Index < Elems; Index++)
  152. {
  153. AILLabel LblLe = new AILLabel();
  154. AILLabel LblGeEnd = new AILLabel();
  155. EmitVectorExtract(Context, Op.Rn, Index, Op.Size + 1, SignedSrc);
  156. Context.Emit(OpCodes.Dup);
  157. Context.EmitLdc_I4(TMaxValue);
  158. Context.Emit(OpCodes.Conv_U8);
  159. Context.Emit(SignedSrc ? OpCodes.Ble_S : OpCodes.Ble_Un_S, LblLe);
  160. Context.Emit(OpCodes.Pop);
  161. Context.EmitLdc_I4(TMaxValue);
  162. Context.EmitLdc_I8(0x8000000L);
  163. Context.EmitSttmp();
  164. Context.Emit(OpCodes.Br_S, LblGeEnd);
  165. Context.MarkLabel(LblLe);
  166. Context.Emit(OpCodes.Dup);
  167. Context.EmitLdc_I4(TMinValue);
  168. Context.Emit(OpCodes.Conv_I8);
  169. Context.Emit(SignedSrc ? OpCodes.Bge_S : OpCodes.Bge_Un_S, LblGeEnd);
  170. Context.Emit(OpCodes.Pop);
  171. Context.EmitLdc_I4(TMinValue);
  172. Context.EmitLdc_I8(0x8000000L);
  173. Context.EmitSttmp();
  174. Context.MarkLabel(LblGeEnd);
  175. if (Scalar)
  176. {
  177. EmitVectorZeroLower(Context, Op.Rd);
  178. }
  179. EmitVectorInsert(Context, Op.Rd, Part + Index, Op.Size);
  180. }
  181. if (Part == 0)
  182. {
  183. EmitVectorZeroUpper(Context, Op.Rd);
  184. }
  185. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  186. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  187. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  188. Context.EmitLdtmp();
  189. Context.Emit(OpCodes.Conv_I4);
  190. Context.Emit(OpCodes.Or);
  191. Context.EmitCallPropSet(typeof(AThreadState), nameof(AThreadState.Fpsr));
  192. }
  193. public static void Fabd_S(AILEmitterCtx Context)
  194. {
  195. EmitScalarBinaryOpF(Context, () =>
  196. {
  197. Context.Emit(OpCodes.Sub);
  198. EmitUnaryMathCall(Context, nameof(Math.Abs));
  199. });
  200. }
  201. public static void Fabs_S(AILEmitterCtx Context)
  202. {
  203. EmitScalarUnaryOpF(Context, () =>
  204. {
  205. EmitUnaryMathCall(Context, nameof(Math.Abs));
  206. });
  207. }
  208. public static void Fabs_V(AILEmitterCtx Context)
  209. {
  210. EmitVectorUnaryOpF(Context, () =>
  211. {
  212. EmitUnaryMathCall(Context, nameof(Math.Abs));
  213. });
  214. }
  215. public static void Fadd_S(AILEmitterCtx Context)
  216. {
  217. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  218. {
  219. EmitSseOrSse2CallF(Context, nameof(Sse.AddScalar));
  220. }
  221. else
  222. {
  223. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  224. }
  225. }
  226. public static void Fadd_V(AILEmitterCtx Context)
  227. {
  228. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  229. {
  230. EmitSseOrSse2CallF(Context, nameof(Sse.Add));
  231. }
  232. else
  233. {
  234. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Add));
  235. }
  236. }
  237. public static void Faddp_S(AILEmitterCtx Context)
  238. {
  239. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  240. int SizeF = Op.Size & 1;
  241. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  242. EmitVectorExtractF(Context, Op.Rn, 1, SizeF);
  243. Context.Emit(OpCodes.Add);
  244. EmitScalarSetF(Context, Op.Rd, SizeF);
  245. }
  246. public static void Faddp_V(AILEmitterCtx Context)
  247. {
  248. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  249. int SizeF = Op.Size & 1;
  250. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  251. int Elems = Bytes >> SizeF + 2;
  252. int Half = Elems >> 1;
  253. for (int Index = 0; Index < Elems; Index++)
  254. {
  255. int Elem = (Index & (Half - 1)) << 1;
  256. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 0, SizeF);
  257. EmitVectorExtractF(Context, Index < Half ? Op.Rn : Op.Rm, Elem + 1, SizeF);
  258. Context.Emit(OpCodes.Add);
  259. EmitVectorInsertTmpF(Context, Index, SizeF);
  260. }
  261. Context.EmitLdvectmp();
  262. Context.EmitStvec(Op.Rd);
  263. if (Op.RegisterSize == ARegisterSize.SIMD64)
  264. {
  265. EmitVectorZeroUpper(Context, Op.Rd);
  266. }
  267. }
  268. public static void Fdiv_S(AILEmitterCtx Context)
  269. {
  270. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  271. {
  272. EmitSseOrSse2CallF(Context, nameof(Sse.DivideScalar));
  273. }
  274. else
  275. {
  276. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  277. }
  278. }
  279. public static void Fdiv_V(AILEmitterCtx Context)
  280. {
  281. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  282. {
  283. EmitSseOrSse2CallF(Context, nameof(Sse.Divide));
  284. }
  285. else
  286. {
  287. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Div));
  288. }
  289. }
  290. public static void Fmadd_S(AILEmitterCtx Context)
  291. {
  292. EmitScalarTernaryRaOpF(Context, () =>
  293. {
  294. Context.Emit(OpCodes.Mul);
  295. Context.Emit(OpCodes.Add);
  296. });
  297. }
  298. public static void Fmax_S(AILEmitterCtx Context)
  299. {
  300. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  301. EmitScalarBinaryOpF(Context, () =>
  302. {
  303. if (Op.Size == 0)
  304. {
  305. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  306. }
  307. else if (Op.Size == 1)
  308. {
  309. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  310. }
  311. else
  312. {
  313. throw new InvalidOperationException();
  314. }
  315. });
  316. }
  317. public static void Fmax_V(AILEmitterCtx Context)
  318. {
  319. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  320. EmitVectorBinaryOpF(Context, () =>
  321. {
  322. if (Op.Size == 0)
  323. {
  324. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MaxF));
  325. }
  326. else if (Op.Size == 1)
  327. {
  328. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Max));
  329. }
  330. else
  331. {
  332. throw new InvalidOperationException();
  333. }
  334. });
  335. }
  336. public static void Fmin_S(AILEmitterCtx Context)
  337. {
  338. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  339. EmitScalarBinaryOpF(Context, () =>
  340. {
  341. if (Op.Size == 0)
  342. {
  343. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  344. }
  345. else if (Op.Size == 1)
  346. {
  347. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  348. }
  349. else
  350. {
  351. throw new InvalidOperationException();
  352. }
  353. });
  354. }
  355. public static void Fmin_V(AILEmitterCtx Context)
  356. {
  357. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  358. int SizeF = Op.Size & 1;
  359. EmitVectorBinaryOpF(Context, () =>
  360. {
  361. if (SizeF == 0)
  362. {
  363. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.MinF));
  364. }
  365. else if (SizeF == 1)
  366. {
  367. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Min));
  368. }
  369. else
  370. {
  371. throw new InvalidOperationException();
  372. }
  373. });
  374. }
  375. public static void Fmaxnm_S(AILEmitterCtx Context)
  376. {
  377. Fmax_S(Context);
  378. }
  379. public static void Fminnm_S(AILEmitterCtx Context)
  380. {
  381. Fmin_S(Context);
  382. }
  383. public static void Fmla_Se(AILEmitterCtx Context)
  384. {
  385. EmitScalarTernaryOpByElemF(Context, () =>
  386. {
  387. Context.Emit(OpCodes.Mul);
  388. Context.Emit(OpCodes.Add);
  389. });
  390. }
  391. public static void Fmla_V(AILEmitterCtx Context)
  392. {
  393. EmitVectorTernaryOpF(Context, () =>
  394. {
  395. Context.Emit(OpCodes.Mul);
  396. Context.Emit(OpCodes.Add);
  397. });
  398. }
  399. public static void Fmla_Ve(AILEmitterCtx Context)
  400. {
  401. EmitVectorTernaryOpByElemF(Context, () =>
  402. {
  403. Context.Emit(OpCodes.Mul);
  404. Context.Emit(OpCodes.Add);
  405. });
  406. }
  407. public static void Fmls_V(AILEmitterCtx Context)
  408. {
  409. EmitVectorTernaryOpF(Context, () =>
  410. {
  411. Context.Emit(OpCodes.Mul);
  412. Context.Emit(OpCodes.Sub);
  413. });
  414. }
  415. public static void Fmls_Ve(AILEmitterCtx Context)
  416. {
  417. EmitVectorTernaryOpByElemF(Context, () =>
  418. {
  419. Context.Emit(OpCodes.Mul);
  420. Context.Emit(OpCodes.Sub);
  421. });
  422. }
  423. public static void Fmsub_S(AILEmitterCtx Context)
  424. {
  425. EmitScalarTernaryRaOpF(Context, () =>
  426. {
  427. Context.Emit(OpCodes.Mul);
  428. Context.Emit(OpCodes.Sub);
  429. });
  430. }
  431. public static void Fmul_S(AILEmitterCtx Context)
  432. {
  433. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  434. {
  435. EmitSseOrSse2CallF(Context, nameof(Sse.MultiplyScalar));
  436. }
  437. else
  438. {
  439. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  440. }
  441. }
  442. public static void Fmul_Se(AILEmitterCtx Context)
  443. {
  444. EmitScalarBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  445. }
  446. public static void Fmul_V(AILEmitterCtx Context)
  447. {
  448. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  449. {
  450. EmitSseOrSse2CallF(Context, nameof(Sse.Multiply));
  451. }
  452. else
  453. {
  454. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Mul));
  455. }
  456. }
  457. public static void Fmul_Ve(AILEmitterCtx Context)
  458. {
  459. EmitVectorBinaryOpByElemF(Context, () => Context.Emit(OpCodes.Mul));
  460. }
  461. public static void Fneg_S(AILEmitterCtx Context)
  462. {
  463. EmitScalarUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  464. }
  465. public static void Fneg_V(AILEmitterCtx Context)
  466. {
  467. EmitVectorUnaryOpF(Context, () => Context.Emit(OpCodes.Neg));
  468. }
  469. public static void Fnmadd_S(AILEmitterCtx Context)
  470. {
  471. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  472. int SizeF = Op.Size & 1;
  473. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  474. Context.Emit(OpCodes.Neg);
  475. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  476. Context.Emit(OpCodes.Mul);
  477. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  478. Context.Emit(OpCodes.Sub);
  479. EmitScalarSetF(Context, Op.Rd, SizeF);
  480. }
  481. public static void Fnmsub_S(AILEmitterCtx Context)
  482. {
  483. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  484. int SizeF = Op.Size & 1;
  485. EmitVectorExtractF(Context, Op.Rn, 0, SizeF);
  486. EmitVectorExtractF(Context, Op.Rm, 0, SizeF);
  487. Context.Emit(OpCodes.Mul);
  488. EmitVectorExtractF(Context, Op.Ra, 0, SizeF);
  489. Context.Emit(OpCodes.Sub);
  490. EmitScalarSetF(Context, Op.Rd, SizeF);
  491. }
  492. public static void Fnmul_S(AILEmitterCtx Context)
  493. {
  494. EmitScalarBinaryOpF(Context, () =>
  495. {
  496. Context.Emit(OpCodes.Mul);
  497. Context.Emit(OpCodes.Neg);
  498. });
  499. }
  500. public static void Frecpe_S(AILEmitterCtx Context)
  501. {
  502. EmitFrecpe(Context, 0, Scalar: true);
  503. }
  504. public static void Frecpe_V(AILEmitterCtx Context)
  505. {
  506. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  507. int SizeF = Op.Size & 1;
  508. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  509. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  510. {
  511. EmitFrecpe(Context, Index, Scalar: false);
  512. }
  513. if (Op.RegisterSize == ARegisterSize.SIMD64)
  514. {
  515. EmitVectorZeroUpper(Context, Op.Rd);
  516. }
  517. }
  518. private static void EmitFrecpe(AILEmitterCtx Context, int Index, bool Scalar)
  519. {
  520. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  521. int SizeF = Op.Size & 1;
  522. if (SizeF == 0)
  523. {
  524. Context.EmitLdc_R4(1);
  525. }
  526. else /* if (SizeF == 1) */
  527. {
  528. Context.EmitLdc_R8(1);
  529. }
  530. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  531. Context.Emit(OpCodes.Div);
  532. if (Scalar)
  533. {
  534. EmitVectorZeroAll(Context, Op.Rd);
  535. }
  536. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  537. }
  538. public static void Frecps_S(AILEmitterCtx Context)
  539. {
  540. EmitFrecps(Context, 0, Scalar: true);
  541. }
  542. public static void Frecps_V(AILEmitterCtx Context)
  543. {
  544. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  545. int SizeF = Op.Size & 1;
  546. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  547. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  548. {
  549. EmitFrecps(Context, Index, Scalar: false);
  550. }
  551. if (Op.RegisterSize == ARegisterSize.SIMD64)
  552. {
  553. EmitVectorZeroUpper(Context, Op.Rd);
  554. }
  555. }
  556. private static void EmitFrecps(AILEmitterCtx Context, int Index, bool Scalar)
  557. {
  558. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  559. int SizeF = Op.Size & 1;
  560. if (SizeF == 0)
  561. {
  562. Context.EmitLdc_R4(2);
  563. }
  564. else /* if (SizeF == 1) */
  565. {
  566. Context.EmitLdc_R8(2);
  567. }
  568. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  569. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  570. Context.Emit(OpCodes.Mul);
  571. Context.Emit(OpCodes.Sub);
  572. if (Scalar)
  573. {
  574. EmitVectorZeroAll(Context, Op.Rd);
  575. }
  576. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  577. }
  578. public static void Frinta_S(AILEmitterCtx Context)
  579. {
  580. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  581. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  582. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  583. EmitScalarSetF(Context, Op.Rd, Op.Size);
  584. }
  585. public static void Frinta_V(AILEmitterCtx Context)
  586. {
  587. EmitVectorUnaryOpF(Context, () =>
  588. {
  589. EmitRoundMathCall(Context, MidpointRounding.AwayFromZero);
  590. });
  591. }
  592. public static void Frinti_S(AILEmitterCtx Context)
  593. {
  594. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  595. EmitScalarUnaryOpF(Context, () =>
  596. {
  597. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  598. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  599. if (Op.Size == 0)
  600. {
  601. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  602. }
  603. else if (Op.Size == 1)
  604. {
  605. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  606. }
  607. else
  608. {
  609. throw new InvalidOperationException();
  610. }
  611. });
  612. }
  613. public static void Frinti_V(AILEmitterCtx Context)
  614. {
  615. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  616. int SizeF = Op.Size & 1;
  617. EmitVectorUnaryOpF(Context, () =>
  618. {
  619. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  620. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  621. if (SizeF == 0)
  622. {
  623. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  624. }
  625. else if (SizeF == 1)
  626. {
  627. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  628. }
  629. else
  630. {
  631. throw new InvalidOperationException();
  632. }
  633. });
  634. }
  635. public static void Frintm_S(AILEmitterCtx Context)
  636. {
  637. EmitScalarUnaryOpF(Context, () =>
  638. {
  639. EmitUnaryMathCall(Context, nameof(Math.Floor));
  640. });
  641. }
  642. public static void Frintm_V(AILEmitterCtx Context)
  643. {
  644. EmitVectorUnaryOpF(Context, () =>
  645. {
  646. EmitUnaryMathCall(Context, nameof(Math.Floor));
  647. });
  648. }
  649. public static void Frintn_S(AILEmitterCtx Context)
  650. {
  651. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  652. EmitVectorExtractF(Context, Op.Rn, 0, Op.Size);
  653. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  654. EmitScalarSetF(Context, Op.Rd, Op.Size);
  655. }
  656. public static void Frintn_V(AILEmitterCtx Context)
  657. {
  658. EmitVectorUnaryOpF(Context, () =>
  659. {
  660. EmitRoundMathCall(Context, MidpointRounding.ToEven);
  661. });
  662. }
  663. public static void Frintp_S(AILEmitterCtx Context)
  664. {
  665. EmitScalarUnaryOpF(Context, () =>
  666. {
  667. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  668. });
  669. }
  670. public static void Frintp_V(AILEmitterCtx Context)
  671. {
  672. EmitVectorUnaryOpF(Context, () =>
  673. {
  674. EmitUnaryMathCall(Context, nameof(Math.Ceiling));
  675. });
  676. }
  677. public static void Frintx_S(AILEmitterCtx Context)
  678. {
  679. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  680. EmitScalarUnaryOpF(Context, () =>
  681. {
  682. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  683. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  684. if (Op.Size == 0)
  685. {
  686. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  687. }
  688. else if (Op.Size == 1)
  689. {
  690. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  691. }
  692. else
  693. {
  694. throw new InvalidOperationException();
  695. }
  696. });
  697. }
  698. public static void Frintx_V(AILEmitterCtx Context)
  699. {
  700. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  701. EmitVectorUnaryOpF(Context, () =>
  702. {
  703. Context.EmitLdarg(ATranslatedSub.StateArgIdx);
  704. Context.EmitCallPropGet(typeof(AThreadState), nameof(AThreadState.Fpcr));
  705. if (Op.Size == 0)
  706. {
  707. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.RoundF));
  708. }
  709. else if (Op.Size == 1)
  710. {
  711. AVectorHelper.EmitCall(Context, nameof(AVectorHelper.Round));
  712. }
  713. else
  714. {
  715. throw new InvalidOperationException();
  716. }
  717. });
  718. }
  719. public static void Frsqrte_S(AILEmitterCtx Context)
  720. {
  721. EmitScalarUnaryOpF(Context, () =>
  722. {
  723. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  724. });
  725. }
  726. public static void Frsqrte_V(AILEmitterCtx Context)
  727. {
  728. EmitVectorUnaryOpF(Context, () =>
  729. {
  730. EmitUnarySoftFloatCall(Context, nameof(ASoftFloat.InvSqrtEstimate));
  731. });
  732. }
  733. public static void Frsqrts_S(AILEmitterCtx Context)
  734. {
  735. EmitFrsqrts(Context, 0, Scalar: true);
  736. }
  737. public static void Frsqrts_V(AILEmitterCtx Context)
  738. {
  739. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  740. int SizeF = Op.Size & 1;
  741. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  742. for (int Index = 0; Index < Bytes >> SizeF + 2; Index++)
  743. {
  744. EmitFrsqrts(Context, Index, Scalar: false);
  745. }
  746. if (Op.RegisterSize == ARegisterSize.SIMD64)
  747. {
  748. EmitVectorZeroUpper(Context, Op.Rd);
  749. }
  750. }
  751. private static void EmitFrsqrts(AILEmitterCtx Context, int Index, bool Scalar)
  752. {
  753. AOpCodeSimdReg Op = (AOpCodeSimdReg)Context.CurrOp;
  754. int SizeF = Op.Size & 1;
  755. if (SizeF == 0)
  756. {
  757. Context.EmitLdc_R4(3);
  758. }
  759. else /* if (SizeF == 1) */
  760. {
  761. Context.EmitLdc_R8(3);
  762. }
  763. EmitVectorExtractF(Context, Op.Rn, Index, SizeF);
  764. EmitVectorExtractF(Context, Op.Rm, Index, SizeF);
  765. Context.Emit(OpCodes.Mul);
  766. Context.Emit(OpCodes.Sub);
  767. if (SizeF == 0)
  768. {
  769. Context.EmitLdc_R4(0.5f);
  770. }
  771. else /* if (SizeF == 1) */
  772. {
  773. Context.EmitLdc_R8(0.5);
  774. }
  775. Context.Emit(OpCodes.Mul);
  776. if (Scalar)
  777. {
  778. EmitVectorZeroAll(Context, Op.Rd);
  779. }
  780. EmitVectorInsertF(Context, Op.Rd, Index, SizeF);
  781. }
  782. public static void Fsqrt_S(AILEmitterCtx Context)
  783. {
  784. EmitScalarUnaryOpF(Context, () =>
  785. {
  786. EmitUnaryMathCall(Context, nameof(Math.Sqrt));
  787. });
  788. }
  789. public static void Fsub_S(AILEmitterCtx Context)
  790. {
  791. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  792. {
  793. EmitSseOrSse2CallF(Context, nameof(Sse.SubtractScalar));
  794. }
  795. else
  796. {
  797. EmitScalarBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  798. }
  799. }
  800. public static void Fsub_V(AILEmitterCtx Context)
  801. {
  802. if (AOptimizations.UseSse && AOptimizations.UseSse2)
  803. {
  804. EmitSseOrSse2CallF(Context, nameof(Sse.Subtract));
  805. }
  806. else
  807. {
  808. EmitVectorBinaryOpF(Context, () => Context.Emit(OpCodes.Sub));
  809. }
  810. }
  811. public static void Mla_V(AILEmitterCtx Context)
  812. {
  813. EmitVectorTernaryOpZx(Context, () =>
  814. {
  815. Context.Emit(OpCodes.Mul);
  816. Context.Emit(OpCodes.Add);
  817. });
  818. }
  819. public static void Mla_Ve(AILEmitterCtx Context)
  820. {
  821. EmitVectorTernaryOpByElemZx(Context, () =>
  822. {
  823. Context.Emit(OpCodes.Mul);
  824. Context.Emit(OpCodes.Add);
  825. });
  826. }
  827. public static void Mls_V(AILEmitterCtx Context)
  828. {
  829. EmitVectorTernaryOpZx(Context, () =>
  830. {
  831. Context.Emit(OpCodes.Mul);
  832. Context.Emit(OpCodes.Sub);
  833. });
  834. }
  835. public static void Mul_V(AILEmitterCtx Context)
  836. {
  837. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  838. }
  839. public static void Mul_Ve(AILEmitterCtx Context)
  840. {
  841. EmitVectorBinaryOpByElemZx(Context, () => Context.Emit(OpCodes.Mul));
  842. }
  843. public static void Neg_S(AILEmitterCtx Context)
  844. {
  845. EmitScalarUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  846. }
  847. public static void Neg_V(AILEmitterCtx Context)
  848. {
  849. EmitVectorUnaryOpSx(Context, () => Context.Emit(OpCodes.Neg));
  850. }
  851. public static void Raddhn_V(AILEmitterCtx Context)
  852. {
  853. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Add), Round: true);
  854. }
  855. public static void Rsubhn_V(AILEmitterCtx Context)
  856. {
  857. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: true);
  858. }
  859. public static void Saba_V(AILEmitterCtx Context)
  860. {
  861. EmitVectorTernaryOpSx(Context, () =>
  862. {
  863. Context.Emit(OpCodes.Sub);
  864. EmitAbs(Context);
  865. Context.Emit(OpCodes.Add);
  866. });
  867. }
  868. public static void Sabal_V(AILEmitterCtx Context)
  869. {
  870. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  871. {
  872. Context.Emit(OpCodes.Sub);
  873. EmitAbs(Context);
  874. Context.Emit(OpCodes.Add);
  875. });
  876. }
  877. public static void Sabd_V(AILEmitterCtx Context)
  878. {
  879. EmitVectorBinaryOpSx(Context, () =>
  880. {
  881. Context.Emit(OpCodes.Sub);
  882. EmitAbs(Context);
  883. });
  884. }
  885. public static void Sabdl_V(AILEmitterCtx Context)
  886. {
  887. EmitVectorWidenRnRmBinaryOpSx(Context, () =>
  888. {
  889. Context.Emit(OpCodes.Sub);
  890. EmitAbs(Context);
  891. });
  892. }
  893. public static void Saddw_V(AILEmitterCtx Context)
  894. {
  895. EmitVectorWidenRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Add));
  896. }
  897. public static void Smax_V(AILEmitterCtx Context)
  898. {
  899. Type[] Types = new Type[] { typeof(long), typeof(long) };
  900. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  901. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  902. }
  903. public static void Smaxp_V(AILEmitterCtx Context)
  904. {
  905. Type[] Types = new Type[] { typeof(long), typeof(long) };
  906. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  907. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  908. }
  909. public static void Smin_V(AILEmitterCtx Context)
  910. {
  911. Type[] Types = new Type[] { typeof(long), typeof(long) };
  912. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  913. EmitVectorBinaryOpSx(Context, () => Context.EmitCall(MthdInfo));
  914. }
  915. public static void Sminp_V(AILEmitterCtx Context)
  916. {
  917. Type[] Types = new Type[] { typeof(long), typeof(long) };
  918. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  919. EmitVectorPairwiseOpSx(Context, () => Context.EmitCall(MthdInfo));
  920. }
  921. public static void Smlal_V(AILEmitterCtx Context)
  922. {
  923. EmitVectorWidenRnRmTernaryOpSx(Context, () =>
  924. {
  925. Context.Emit(OpCodes.Mul);
  926. Context.Emit(OpCodes.Add);
  927. });
  928. }
  929. public static void Smull_V(AILEmitterCtx Context)
  930. {
  931. EmitVectorWidenRnRmBinaryOpSx(Context, () => Context.Emit(OpCodes.Mul));
  932. }
  933. public static void Sqxtn_S(AILEmitterCtx Context)
  934. {
  935. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: true, Scalar: true);
  936. }
  937. public static void Sqxtn_V(AILEmitterCtx Context)
  938. {
  939. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: true, Scalar: false);
  940. }
  941. public static void Sqxtun_S(AILEmitterCtx Context)
  942. {
  943. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: false, Scalar: true);
  944. }
  945. public static void Sqxtun_V(AILEmitterCtx Context)
  946. {
  947. EmitSaturatingExtNarrow(Context, SignedSrc: true, SignedDst: false, Scalar: false);
  948. }
  949. public static void Sub_S(AILEmitterCtx Context)
  950. {
  951. EmitScalarBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  952. }
  953. public static void Sub_V(AILEmitterCtx Context)
  954. {
  955. if (AOptimizations.UseSse2)
  956. {
  957. EmitSse2Call(Context, nameof(Sse2.Subtract));
  958. }
  959. else
  960. {
  961. EmitVectorBinaryOpZx(Context, () => Context.Emit(OpCodes.Sub));
  962. }
  963. }
  964. public static void Subhn_V(AILEmitterCtx Context)
  965. {
  966. EmitHighNarrow(Context, () => Context.Emit(OpCodes.Sub), Round: false);
  967. }
  968. public static void Uaba_V(AILEmitterCtx Context)
  969. {
  970. EmitVectorTernaryOpZx(Context, () =>
  971. {
  972. Context.Emit(OpCodes.Sub);
  973. EmitAbs(Context);
  974. Context.Emit(OpCodes.Add);
  975. });
  976. }
  977. public static void Uabal_V(AILEmitterCtx Context)
  978. {
  979. EmitVectorWidenRnRmTernaryOpZx(Context, () =>
  980. {
  981. Context.Emit(OpCodes.Sub);
  982. EmitAbs(Context);
  983. Context.Emit(OpCodes.Add);
  984. });
  985. }
  986. public static void Uabd_V(AILEmitterCtx Context)
  987. {
  988. EmitVectorBinaryOpZx(Context, () =>
  989. {
  990. Context.Emit(OpCodes.Sub);
  991. EmitAbs(Context);
  992. });
  993. }
  994. public static void Uabdl_V(AILEmitterCtx Context)
  995. {
  996. EmitVectorWidenRnRmBinaryOpZx(Context, () =>
  997. {
  998. Context.Emit(OpCodes.Sub);
  999. EmitAbs(Context);
  1000. });
  1001. }
  1002. public static void Uaddl_V(AILEmitterCtx Context)
  1003. {
  1004. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  1005. }
  1006. public static void Uaddlv_V(AILEmitterCtx Context)
  1007. {
  1008. AOpCodeSimd Op = (AOpCodeSimd)Context.CurrOp;
  1009. int Bytes = Context.CurrOp.GetBitsCount() >> 3;
  1010. EmitVectorExtractZx(Context, Op.Rn, 0, Op.Size);
  1011. for (int Index = 1; Index < (Bytes >> Op.Size); Index++)
  1012. {
  1013. EmitVectorExtractZx(Context, Op.Rn, Index, Op.Size);
  1014. Context.Emit(OpCodes.Add);
  1015. }
  1016. EmitScalarSet(Context, Op.Rd, Op.Size + 1);
  1017. }
  1018. public static void Uaddw_V(AILEmitterCtx Context)
  1019. {
  1020. EmitVectorWidenRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Add));
  1021. }
  1022. public static void Uhadd_V(AILEmitterCtx Context)
  1023. {
  1024. EmitVectorBinaryOpZx(Context, () =>
  1025. {
  1026. Context.Emit(OpCodes.Add);
  1027. Context.EmitLdc_I4(1);
  1028. Context.Emit(OpCodes.Shr_Un);
  1029. });
  1030. }
  1031. public static void Umin_V(AILEmitterCtx Context)
  1032. {
  1033. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  1034. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  1035. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  1036. }
  1037. public static void Uminp_V(AILEmitterCtx Context)
  1038. {
  1039. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  1040. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Min), Types);
  1041. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  1042. }
  1043. public static void Umax_V(AILEmitterCtx Context)
  1044. {
  1045. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  1046. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  1047. EmitVectorBinaryOpZx(Context, () => Context.EmitCall(MthdInfo));
  1048. }
  1049. public static void Umaxp_V(AILEmitterCtx Context)
  1050. {
  1051. Type[] Types = new Type[] { typeof(ulong), typeof(ulong) };
  1052. MethodInfo MthdInfo = typeof(Math).GetMethod(nameof(Math.Max), Types);
  1053. EmitVectorPairwiseOpZx(Context, () => Context.EmitCall(MthdInfo));
  1054. }
  1055. public static void Umull_V(AILEmitterCtx Context)
  1056. {
  1057. EmitVectorWidenRnRmBinaryOpZx(Context, () => Context.Emit(OpCodes.Mul));
  1058. }
  1059. public static void Uqxtn_S(AILEmitterCtx Context)
  1060. {
  1061. EmitSaturatingExtNarrow(Context, SignedSrc: false, SignedDst: false, Scalar: true);
  1062. }
  1063. public static void Uqxtn_V(AILEmitterCtx Context)
  1064. {
  1065. EmitSaturatingExtNarrow(Context, SignedSrc: false, SignedDst: false, Scalar: false);
  1066. }
  1067. }
  1068. }