<div dir="ltr"><div>Hello Nathan, dear all,</div><div><br></div><div>&gt; We were attempting to use scsi-target-utils, hosted on a xen dom0 vm using localhost, </div><div>&gt; and running into some problems.  I was not able to reproduce this on a centos 7.2 </div><div>&gt; server using the default kernel.</div><div><br></div><div>I am seeing comparable things on our centos6 xen servers running 3.18 kernels. We have about 20 of those machines running and have started upgrading them from 3.10.68 to 3.18 a couple of weeks ago. But currently, at 3/4 of finishing, I&#39;m having second thoughts and am thinking about rolling back because of reliability issues.</div><div><br></div><div>Stuff I&#39;ve tried before is taking care that all machine runs latest BIOS&#39;es and ethernet firmware. The servers in question are Dell PowerEdges from different generations, talking to an Equallogic diskarray over 1Gbit copper. Dells toolset is installed, OMSA as well as hitkit.</div><div><br></div><div>The errors I&#39;m seeing are looking like this:</div><div><br></div><div>Apr 13 23:03:43 xen15-2 iscsid: Kernel reported iSCSI connection 25:0 error (1020 - ISCSI_ERR_TCP_CONN_CLOSE: TCP connection closed) state (1)</div><div>Apr 13 23:03:43 xen15-2 iscsid: Connection25:0 to [target: iqn.xxxxx, portal: a.b.c.d,3260] through [iface: eql.em2] is operational now</div><div>Apr 13 23:03:48 xen15-2 iscsid: Connection9:0 to [target: iqn.xxxxx, portal: a.b.c.d,3260] through [iface: eql.em2] is shutdown.</div><div><br></div><div>While the the only noticeable difference in dmesg output is stuff like this:</div><div>(on 3.18)</div><div>pci 0000:02:00.0: can&#39;t claim BAR 6 [mem 0xfff00000-0xffffffff pref]: no compatible bridge window</div><div>pci 0000:01:00.0: can&#39;t claim BAR 6 [mem 0xfff80000-0xffffffff pref]: no compatible bridge window</div><div>pci 0000:01:00.0: BAR 6: assigned [mem 0x91e80000-0x91efffff pref]</div><div>pci 0000:01:00.1: BAR 6: no space for [mem size 0x00080000 pref]</div><div>pci 0000:01:00.1: BAR 6: failed to assign [mem size 0x00080000 pref]</div><div>pci 0000:01:00.2: BAR 6: no space for [mem size 0x00080000 pref]</div><div>pci 0000:01:00.2: BAR 6: failed to assign [mem size 0x00080000 pref]</div><div>pci 0000:01:00.3: BAR 6: no space for [mem size 0x00080000 pref]</div><div>pci 0000:01:00.3: BAR 6: failed to assign [mem size 0x00080000 pref]</div><div>(and on 3.10)</div><div>pci 0000:00:03.0: BAR 15: assigned [mem 0xd5200000-0xd53fffff pref]</div><div>pci 0000:01:00.1: BAR 6: assigned [mem 0xd5000000-0xd507ffff pref]</div><div>pci 0000:01:00.2: BAR 6: assigned [mem 0xd5080000-0xd50fffff pref]</div><div>pci 0000:01:00.3: BAR 6: assigned [mem 0xd5100000-0xd517ffff pref]</div><div>pci 0000:00:01.0: PCI bridge to [bus 01]</div><div>pci 0000:00:01.0:   bridge window [mem 0xd8000000-0xd8ffffff]</div><div>pci 0000:00:01.0:   bridge window [mem 0xd5000000-0xd51fffff pref]</div><div><br></div><div>But to be honest, my knowledge as to the possible cause of this is lacking. Is this just a small ACPI related glitch or is it the sign ethernet cards are misbehaving somehow?</div><div><br></div><div>Are more people seeing errors in this area?</div><div><br></div><div>Thx and regards,</div><div>-- Hans (just trying to make sense of it all)</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016-04-11 22:14 GMT+02:00 Nathan Coulson <span dir="ltr">&lt;<a href="mailto:nathan@bravenet.com" target="_blank">nathan@bravenet.com</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello<br>
<br>
We were attempting to use scsi-target-utils, hosted on a xen dom0 vm using localhost, and running into some problems.  I was not able to reproduce this on a centos 7.2 server using the default kernel.<br>
<br>
<br>
(From dmesg)<br>
Apr  4 11:18:42 funk kernel: [  596.511204]  connection2:0: detected conn error (1022)<br>
Apr  4 11:18:42 funk kernel: connection2:0: ping timeout of 5 secs expired, recv timeout 5, last rx 4295253788, last ping 4295258790, now 4295263808<br>
Apr  4 11:18:42 funk kernel: connection2:0: detected conn error (1022)<br>
Apr  4 11:18:42 funk iscsid: Kernel reported iSCSI connection 2:0 error (1022 - Invalid or unknown error code) state (3)<br>
Apr  4 11:18:44 funk iscsid: connection2:0 is operational after recovery (1 attempts)<br>
<br>
Repeated a few times, until eventually<br>
<br>
<br>
Apr  4 11:19:44 funk kernel: Result: hostbyte=DID_TRANSPORT_DISRUPTED driverbyte=DRIVER_OK<br>
Apr  4 11:19:44 funk kernel: sd 7:0:0:1: [sdd] CDB:<br>
Apr  4 11:19:44 funk kernel: Write(10): 2a 00 01 df c7 e8 00 00 18 00<br>
Apr  4 11:19:44 funk kernel: blk_update_request: I/O error, dev sdd, sector 31442920<br>
Apr  4 11:19:44 funk kernel: [  658.127596] sd 7:0:0:1: [sdd]<br>
Apr  4 11:19:44 funk kernel: [  658.127688] Result: hostbyte=DID_TRANSPORT_DISRUPTED driverbyte=DRIVER_OK<br>
Apr  4 11:19:44 funk kernel: [  658.127761] sd 7:0:0:1: [sdd] CDB:<br>
Apr  4 11:19:44 funk kernel: [  658.127826] Write(10): 2a 00 01 df c7 e8 00 00 18 00<br>
Apr  4 11:19:44 funk kernel: [  658.127927] blk_update_request: I/O error, dev sdd, sector 31442920<br>
Apr  4 11:19:44 funk kernel: [  658.128040] sd 7:0:0:1: [sdd]<br>
Apr  4 11:19:44 funk kernel: sd 7:0:0:1: [sdd]<br>
Apr  4 11:19:44 funk kernel: [  658.128105] Result: hostbyte=DID_TRANSPORT_DISRUPTED driverbyte=DRIVER_OK<br>
Apr  4 11:19:44 funk kernel: [  658.128177] sd 7:0:0:1: [sdd] CDB:<br>
Apr  4 11:19:44 funk kernel: [  658.128241] Write(10): 2a 00 00 00 08 00 00 00 18 00<br>
Apr  4 11:19:44 funk kernel: [  658.128339] blk_update_request: I/O error, dev sdd, sector 2048<br>
Apr  4 11:19:44 funk kernel: Result: hostbyte=DID_TRANSPORT_DISRUPTED driverbyte=DRIVER_OK<br>
Apr  4 11:19:44 funk kernel: sd 7:0:0:1: [sdd] CDB:<br>
Apr  4 11:19:44 funk kernel: Write(10): 2a 00 00 00 08 00 00 00 18 00<br>
Apr  4 11:19:44 funk kernel: blk_update_request: I/O error, dev sdd, sector 2048<br>
<br>
<br>
(Test Setup)<br>
scsi-target-utils installed via yum, default config<br>
/etc/tgt/conf.d/xenguests.conf<br>
&lt;target iqn.2016-02.com.bravenet:test&gt;<br>
    backing-store //mnt/vmdisk/test # vm image<br>
&lt;/target&gt;<br>
<br>
systemctl tgtd restart<br>
<br>
iscsiadm -m discovery -t sendtargets -p localhost<br>
<br>
iscsiadm -m node -T iqn.2016-02.com.bravenet:test -l<br>
<br>
<br>
add it to lvm (pvcreate, vgcreate), let&#39;s call it /dev/<a href="http://vmdisk.vg/test.lv" rel="noreferrer" target="_blank">vmdisk.vg/test.lv</a><br>
<br>
and then use libvirt to attempt to install an os on /dev/<a href="http://vmdisk.vg/test.lv" rel="noreferrer" target="_blank">vmdisk.vg/test.lv</a>  (using anaconda)<br>
<br>
<br>
<br>
<br>
Around the time it tries to create the disk label, is when the conn errors start, until eventually it gives up trying to create the disk label.<br>
<br>
<br>
<br>
We tested a similar setup on a centos 7.2 host we use kvm based virtualmachine hosting on (default 3.10 kernel), and it worked fine.  It may be similar to what was reported on <a href="https://bugzilla.redhat.com/show_bug.cgi?id=1245990" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/show_bug.cgi?id=1245990</a>, but I never saw a resolution on what they discovered (other then a reference to comment18 which does not appear to exist).<br>
<br>
Testing over the network appears to also work as well (where another machine connects to scsi-target-utils on the funk server above.<br>
<br>
<br>
<br>
<br>
<br>
Longterm Purpose of the above setup, was to get direct access to a filesystem image hosted on a gluster setup, using bs-type glfs on scsi-target-utils.<span class="HOEnZb"><font color="#888888"><br>
<br>
-- <br>
Nathan Coulson<br>
<a href="http://www.bravenet.com" rel="noreferrer" target="_blank">www.bravenet.com</a><br>
<a href="mailto:nathan@bravenet.com" target="_blank">nathan@bravenet.com</a><br>
_______________________________________________<br>
CentOS-virt mailing list<br>
<a href="mailto:CentOS-virt@centos.org" target="_blank">CentOS-virt@centos.org</a><br>
<a href="https://lists.centos.org/mailman/listinfo/centos-virt" rel="noreferrer" target="_blank">https://lists.centos.org/mailman/listinfo/centos-virt</a><br>
</font></span></blockquote></div><br></div>